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STAR Wars (USA 1977) von George Lucas und APocALYPSE Now (USA 
1979) von Francis Ford Coppola markieren einen Wendepunkt in der 
Geschichte des Kinotons. Befragt nach den Prototypen einer neuen Ton- 
ästhetik verweisen Theoretiker und US-amerikanische Praktiker in ver- 
blüffender Einmütigkeit auf diese beiden Produktionen, die mythisch 
überhöhten Kultcharakter angenommen haben. Beide Filme — so unter- 
schiedlich sie in Anspruch und Ausdruckspotenzial auch sind - zelebrie- 
ren die Tonspur als atemberaubendes Spektakel: Kreischende Jets sausen 
über die Köpfe des Publikums, und Hubschrauber durchfliegen alle vier 
Quadranten des Kinoraums. Neu erscheinen auch das Dolby-Stereo- 
Logo auf der Leinwand und die Berufsbezeichnung Sound Designer in 
den Titeln. Zusammen mit Spielbergs CLOSE ENCOUNTERS OF THE THIRD 
Kinp (USA 1977), Ridley Scotts ALIEN (USA 1979) und STAR TREK — THE 
Motion PICTURE (USA 1979, Robert Wise) sind sie Teil jenes Typus von 
Übergangsphänomen, das seine technischen Errungenschaften unge- 
hemmt ausstellt. 

Die Protagonisten des Wandels gehören einer neuen Generation von 
Filmemachern an, die unter dem Label New Hollywood zusammengefasst 
werden. Tatsächlich bezieht sich dieses Label auf keine homogene Grup- 
pierung mit einheitlichen technisch-ästhetischen Zielsetzungen, sondern 
auf ein historisches Phänomen des Umbruchs, dessen einzige Gemeinsam- 
keit in den Veränderungen traditioneller Produktionsformen und formaler 
Gestaltungsstrategien zu sehen ist. Ein Teil dieser neuen Generation waren 
die sogenannten movie brats — unter ihnen Francis Ford Coppola, George 
Lucas, Steven Spielberg und Martin Scorsese -, ein anderer Teil waren 
Fernsehveteranen wie Robert Altman und Arthur Penn, Alan J. Pakula, 
Hal Ashby, William Friedkin. Die movie brats waren Absolventen von Film- 
hochschulen - besonders von Filmabteilungen der kalifornischen Univer- 
sitäten USC und UCLA- und hatten dort Zeit und Gelegenheit, sich mit 
der nordamerikanischen Filmgeschichte und den Tendenzen des neuen 
europäischen Kunstkinos auseinanderzusetzen. 

Ebenso heterogen und komplex wie die Herkunft der verschiedenen 
Vertreter von New Hollywood sind die Gründe und Einflüsse, die den 


14 Einleitung 


Wandel einleiteten und begünstigten. Auf einige der wichtigsten Fakto- 
ren soll kurz ein Schlaglicht geworfen werden; die Ausführungen erheben 
aber keinen Anspruch auf Vollständigkeit. Es ist mehr als Tour d’hori- 
zon gedacht, die das weitere ökonomische und gesellschaftliche Umfeld 
abschreitet, das eine Veränderung der filmischen Klangästhetik begüns- 
tigte. Einige der Aussagen werden im Laufe des Texts nochmals aufge- 
griffen und vertieft. Im Zentrum steht die Frage, warum in Hollywood ein 
Umbruch stattgefunden und wie sich in dieser Periode der Stellenwert der 
Tonspur geändert hat. 

Die Wurzeln des Umbruchs kann man in den ökonomischen Fak- 
toren sehen, die zu einer Schwächung des etablierten Studiosystems in 
Hollywood geführt haben. Zwischen 1946 - dem Jahr mit den besten 
Einspielergebnissen — und 1961 sanken die Box-Office-Einnahmen der 
Kinoindustrie um 46% (Wyatt 1994: 67). Die Gründe dafür lagen in ver- 
änderten Konsumgewohnheiten, die mit sozialen Entwicklungen zusam- 
menhingen. Dazu zählte die Umsiedelung breiter Bevölkerungsschichten 
in die Vororte der Städte. Die suburbane Bevölkerung tendierte dazu, nur 
noch für besondere, «wichtige» Filme ins Kino zu gehen (Thompson/ 
Bordwell 1994: 375). Stattdessen zog das Fernsehen, das 1948 den kom- 
merziellen Betrieb aufgenommen hatte, in die Häuser ein. Wegen die- 
ser Konkurrenz griff die Filmindustrie technische Innovationen auf, mit 
denen sie das Kinoerlebnis aufwerten wollte. Zu Beginn der 1950er-Jahre 
kamen verschiedene Breitwandformate auf, die mit Mehrkanal-Stereo- 
systemen ausgerüstet waren, um Bild und Ton auf gigantische Ausmaße 
aufzublähen. 

1948 hatte außerdem ein Gerichtsentscheid — der sogenannte Para- 
mount Case — die großen Studios wegen monopolistischer Praktiken ver- 
urteilt. Der Oberste Gerichtshof zwang die Majors, sich von ihren Kino- 
ketten zu trennen. Damit sank ihre Macht über die Programmierung und 
Auswertung ihrer Filme. 

In diesem Klima ökonomischer Verunsicherung versuchte Holly- 
wood, auf etablierte, Erfolg versprechende Formeln zurückzugreifen. 
Favorisiert wurden harmlose Produktionen wie Rodgers’ und Hammer- 
steins Broadway-Musicals OKLAHOMA! (USA 1955, Fred Zinnemann), THE 
KING AND I (USA 1956, Walter Lang), SOUTH PAcırıc (USA 1958, Joshua 
Logan) und THE SounD oF Music (USA 1964, Robert Wise). Die Giganto- 
manie, die hinter diesen Produktionen steckte, haben Monumentalfilme 
wie BEN-Hur (USA 1959, William Wyler), THE TEN COMMANDMENTS 
(USA 1956, Cecil B. DeMille) und THE ALAmo (USA 1960, John Wayne) 
noch überboten. Obwohl diese Filme ein riesiges Publikum in die Kinos 
brachten, zeugen sie inhaltlich von der Agonie Hollywoods, die sich unter 
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anderem darin äußert, dass sie Importe von Bühnenshows oder Remakes 
waren. Tonästhetisch brillieren sie vor allem durch die technische Per- 
fektion, mit welcher der Apparat sich selbst feiert. Sechs von dreizehn 
Academy Awards für den besten Ton gingen zwischen 1954 und 1965 an 
Musicals. Diese Wahl könnte allerdings auch eine Reaktion auf McCarthys 
Einfluss in Hollywood sein. 1956 hat man die Regeln für die Verleihung 
des Academy Award geändert: «Niemand darf für einen Oscar nominiert 
werden, der zugibt, der kommunistischen Partei angehört zu haben, und 
seine Mitgliedschaft nicht widerrufen hat, der sich geweigert hat, vor 
einem Ausschuss des Kongresses auszusagen oder der Vorladung eines 
solchen Ausschusses nicht gefolgt ist»! (Academy of Motion Picture Arts 
and Sciences). 

In der Zeit der ökonomischen Dürre wurden einige der großen Stu- 
dios von Konzernen übernommen, die ihr Kapital in anderen Wirtschafts- 
zweigen erworben hatten. Damit zerfiel ein weiterer Grundpfeiler des eta- 
blierten Studiosystems: die hierarchische Gruppierung der kreativen und 
technischen Crew um eine zentrale Autorität, in erster Linie den Direktor 
des Studios, in zweiter Linie die Leiter der verschiedenen Departements. 
Diese Autoritäten waren alt geworden und wurden nun durch jüngere 
Producer ersetzt, die im sogenannten package-mode arbeiteten (Bordwell 
et al. 1985: 330), das heißt, Material und Crew - Techniker, Regisseure und 
Schauspieler — projektbezogen organisierten. Mit diesen Umstrukturie- 
rungsmaßnahmen konzentrierte sich zwar das finanzielle Risiko stärker 
auf die einzelnen Produktionen; auf der anderen Seite erhöhte die Diversi- 
fikation der globalen Konzerne die Risikobereitschaft dank der größeren 
finanziellen Ressourcen aus anderen Wirtschaftszweigen. 

Die Hochglanzprodukte nach konventionellem Strickmuster, allen 
voran THE SOUND OF Music (USA 1964, Robert Wise), erzielten bis Mitte 
der 1960er-Jahre maximale Einspielergebnisse. Danach ging die Rechnung 
nicht mehr auf. Ende der Dekade schreckte der Erfolg einiger Außensei- 
terproduktionen die Industrie auf: 1967 THE GRADUATE (Mike Nichols) 
und BONNIE AND CLYDE (Arthur Penn) sowie 1969 Easy RIDER (Dennis 
Hopper). Diese Produktionen rückten ein neues Zielpublikum in den 
Fokus der Industrie: die Generation der Babyboomer. Sie waren Teil einer 
weitverbreiteten Jugendkultur, die Erfahrungen mit Drogen machte, mit 
sexuellen Tabus brach, Rockmusik hörte und sich über verschiedene anti- 
bürgerliche politische Bewegungen definierte. Wie Europa befanden sich 


1 «No one may be nominated for an Oscar if he has admitted Communist Party member- 
ship and has not renounced that membership, if he has refused to testify before a Con- 
gressional Committee or if he has refused to respond to a subpoena from such a com- 
mittee.» 
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die USA in einem Klima des gesellschaftlichen Umbruchs, deren Exponen- 
ten das Establishment mit provokanten Thesen verunsicherten. Während 
in Europa schon seit Ende der 1950er-, spätestens seit Beginn der 1960er- 
Jahre eine junge Generation den gesellschaftlichen Wandel kinemato- 
grafisch aufgriff und sich gegen das «Kino der Väter» auflehnte, indem 
sie neue Formen des ästhetischen Ausdrucks suchte, wirkten sich diese 
Veränderungen in Hollywood erst ein Jahrzehnt später aus. Anders als 
in Europa verfügte die Filmindustrie in den USA über feste Strukturen, 
die während Jahrzehnten gewachsen waren. Diese Strukturen waren vor 
allem an ökonomischen Zielsetzungen orientiert. Experimentelle Formen 
des filmischen Erzählens konnten sich nur an deren Rändern entwickeln: 
in den B-Pictures, den Horror- und Science-Fiction-Filmen sowie dem 
Thriller des Film noir. 

Nun waren es genau diese ökonomischen Zielsetzungen, welche das 
System zum Umdenken zwangen, als nämlich deutlich wurde, dass die 
einst erfolgreichen Strategien keinen Gewinn mehr erzielten. In dieser 
Phase der Verunsicherung hatten Quereinsteiger oder junge Filmhoch- 
schulabsolventen Gelegenheit, mit kleineren Budgets Filme zu drehen. Die 
movie brats gehörten selbst zur Jugendkultur, sie kannten das Vokabular, 
die Ideen und die Musik, sie waren am Puls der Zeit. 

Die New-Hollywood-Regisseure verstanden sich jedoch nicht mehr 
als Befehlsempfänger in einer starren Hierarchie, sondern als Autoren. Die 
sogenannte Autorentheorie, in den 1950er-Jahren als politique des auteurs 
von den damaligen Kritikern der Cahiers du Cinema — Eric Rohmer, Claude 
Chabrol, Jean-Luc Godard und Francois Truffaut — begründet, rekurrierte 
implizit auf den romantischen Geniekult. Im Zentrum dieses Konzepts 
stand der autonome Schöpfer, der unabhängig von Regeln und Tradi- 
tionen seine ureigensten Visionen umsetzt. Das bedeutete Originalitat 
statt Standardisierung, feinnervig subtile Transformation der Wirklich- 
keit durch den Filter einer höchstpersönlichen Weltsicht statt formelhafte 
Manipulation. Die Filmkritiker der Cahiers richteten ihr Interesse auf jene 
Werke, in denen sie die persönliche Handschrift eines Regisseurs entdeck- 
ten. Neben Jean Renoir, Max Ophüls, Robert Bresson, Jacques Tati und 
anderen französischen Vorbildern verehrten sie Regisseure des amerika- 
nischen Films wie Orson Welles, Alfred Hitchcock, Fritz Lang, Howard 
Hawks und John Ford, starke Regiepersönlichkeiten, die selbst im rigiden 
Studiosystem ihre individuell geprägte Formensprache entfalten konnten. 

In den 1960er-Jahren brachte der Journalist Andrew Sarris die Auto- 
rentheorie in die amerikanische Debatte ein. Im Gegensatz zur französi- 
schen Schule betonte Sarris den genuin kollaborativen Entstehungspro- 
zess des Films, in welchem der Regisseur niemals der alleinige kreative 
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Urheber sein kann, sondern eher eine kreative Instanz, welche die einzel- 
nen bits and pieces in ein zentrales Konzept integriert. 

Die Wirklichkeit des Alltags in der Filmindustrie modifizierte in 
den ersten Jahren die Autorenattitüde der movie brats. Unter anderem 
inszenierte Francis Ford Coppola im Sold von Warner Brothers FINIAN’s 
RAINBOW (USA 1968), eine musikalische Komödie, ohne seine persönliche 
Vision verwirklichen zu können. Als Konsequenz dieser Erfahrung zog er 
zusammen mit den talentiertesten Studenten von USC und UCLA nach 
San Francisco, wo er eine eigene Firma gründete, die American Zoetrope. 
Dort produzierte er THX 1138 (USA 1970), George Lucas’ ersten großen 
Kinofilm, mit einem Darlehen von Warner. 

Erst mit Box-Office-Erfolgen konnten sich die Pioniere der Über- 
gangsphase den nötigen materiellen Freiraum schaffen, um ihre Visionen 
als auteurs umzusetzen: Spielberg mit Jaws (USA 1975), Coppola mit THE 
GODFATHER (PART I USA 1972 und Part II 1974) und Lucas mit AMERICAN 
GRAFFITI (USA 1973). Aus der Position ökonomischer Stärke waren sie in 
der Lage, festgefahrene Produktionsprozesse infrage zu stellen und zu 
verändern. Sie suchten nicht nur neue ästhetische Ausdrucksformen, son- 
dern auch neue Technologien, um die formalen Ideen zu verwirklichen. 

Ihre Tonbesessenheit geht auf den Einfluss der Musikindustrie 
zurück, die seit den späten 1950er-Jahren boomte. Die Jugendkulturen 
zentrierten sich um verschiedene identitätsstiftende Musikstile, die mehr- 
heitlich afroamerikanische Einflüsse aufgriffen. Zwei Merkmale der neuen 
musikalischen Entwicklungen veränderten die Klanglichkeit der Tonspur 
nachhaltig: Die geräuschhafte Komponente — unter anderem Perkussions- 
und verzerrte Instrumentalsounds — wurde zum wesentlichen Bestandteil 
der musikalischen Ästhetik; außerdem entstand diese Musik mit neuen 
technischen Mitteln — mit Verstärker, elektrischer Gitarre und Synthesizer. 
Mitte der 1970er-Jahre war die technologische Entwicklung der kommer- 
ziellen Musikindustrie der Filmproduktion ein Jahrzehnt voraus. Die flä- 
chendeckende Versorgung mit technisch hochwertigen Tonsystemen im 
Consumer-Bereich steigerte die Ansprüche nicht nur der Filmemacher, 
sondern auch des Publikums. Während der ersten Jahre arbeitete die 
New-Hollywood-Generation noch mit dem traditionellen technischen 
Equipment. Als sie später eigene Studios einrichtete, führte sie die wei- 
ter entwickelte Technologie aus der Musikindustrie ein. Begeistert von 
der faszinierenden Reizdimension elektrisch veränderter, geräuschhafter 
Klänge versuchten sie, ein ähnliches Vokabular für die filmische Tonspur 
zu entwickeln. Sie waren überzeugt von der suggestiven Kraft des Sounds. 

Mit dem Konzept des Autorenfilms veränderte sich auch die Arbeits- 
teilung. Die Autoren stellten ihre Filme nicht mehr in standardisierten, 
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stark hierarchischen Strukturen her, sondern — gemäß der Idee des Cinéma 
copain — mit Kollegen, die über immense gestalterische Freiheit verfügten. 
Diese Kollegen waren entweder ehemalige Kommilitonen, die nun eben- 
falls in die Gegend von San Francisco gezogen waren, oder Toningenieure 
aus dem Musiksektor. 

Im Begriff Sound Design, der in diesem Umfeld entstand, schlägt sich 
die neue Auffassung des gestaltenden Eingriffs einer individualisierten 
Schöpferpersönlichkeit nieder. Bis heute jedoch wird Sound Design von 
der Academy of Motion Picture Arts and Sciences nicht als Berufsbezeich- 
nung anerkannt mit der Begründung, es handle sich bei der Tonarbeit 
nicht um eine kreative, sondern um eine rein technische Tätigkeit (Beggs 
1997). Während die Tonverantwortlichen in Nordkalifornien, im Umfeld 
von Coppolas Zoetrope und Lucas’ Skywalker Sound, dennoch weiterhin 
diesen Titel tragen, bevorzugen ihre Kollegen in Los Angeles die Bezeich- 
nung Supervising Sound Editor oder Sound Effects — sie finden den Titel 
Sound Design prätentiös (Mangini 1997). Der Glaubenskrieg entfacht sich 
an der Tatsache, dass in amerikanischen Großproduktionen 20 bis 50 spe- 
zialisierte Fachkräfte an einer Tonspur arbeiten, vom Location Sound Mixer 
(Filmtonmeister) bis zu den Re-Recording Engineers (Mischtonmeistern). 

Die Tätigkeit des Sound Designers umfasst die Erarbeitung eines ton- 
ästhetischen Gesamtkonzepts für die Bereiche Sprache und Geräusch, die 
Kommunikation mit dem Komponisten, die Kreation von einzelnen Klän- 
gen und ihre Montage sowie die Koordination von Arbeitsprozessen und 
-zielen der verschiedenen Abteilungen inklusive Geräuschemacher und 
Nachsynchronisation. Anders als der Leiter des Tondepartments im Stu- 
diosystem ist der Sound Designer nicht nur Manager, sondern auch zen- 
trale kreative Instanz. Er entwickelt einen Stil, erschafft mit klanglichen 
Elementen dramaturgische Verbindungen zwischen Figuren, Orten und 
Objekten und erweitert die emotionale Dimension des Films mit subtilen 
Transformationen des Tonmaterials. 

Seit Beginn der 1930er-Jahre entstehen die Tonspuren des US-ame- 
rikanischen Films in der Postproduktion, also nach Abschluss der Dreh- 
arbeiten. Jene Dialogpassagen, die technisch einwandfrei sind, werden aus 
der Originalaufnahme, die während der Dreharbeiten entsteht, heraus- 
geschnitten und montiert, fehlerhafte oder unverständliche Dialogteile 
nachsynchronisiert und klanglich an die Originalaufnahmen angepasst. 
Die Musik entsteht mehrheitlich ebenfalls erst in der Postproduktion. Syn- 
chron zur Projektion des Films spielt ein Orchester die Musikpassagen im 
Tonstudio ein; elektronische Musik wird ganz oder teilweise vom Kompo- 
nisten selbst hergestellt. Von den sogenannten Sound Effects, die ich vor- 
läufig als Geräusche bezeichne, wird jedes einzelne Element entweder in 
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Geräuscharchiven gesucht, an oft weit verstreuten Orten aufgenommen 
oder vom Geräuschemacher synchron zum Bild produziert. Diese Auf- 
nahmen sind das Rohmaterial, das mit einer Reihe von technischen Gerä- 
ten bearbeitet und dann parallel zum Bild auf mehreren Spuren montiert 
wird. In der Endmischung führen drei verschiedene Mischtonmeister, die 
für die Sparten Sprache, Musik und Geräusche verantwortlich sind, die ver- 
schiedenen Elemente wieder zusammen. In Hollywood-Produktionen 
beherrschten von 1933 bis in die späten 1950er-Jahre musikalische Kom- 
positionen im symphonischen Stil der Spätromantik das Gesamtgefüge 
der Tonspur; im New-Hollywood-Film übernehmen die Geräusche viele 
dieser Funktionen. 

Walter Murch, der Prototyp des Sound Designers, hatte seine Klang- 
visionen vor APOCALYPSE Now bereits in einigen anderen Filmen von 
Lucas und Coppola umgesetzt, unter anderem in THX 1138 (USA 1970, 
George Lucas) und in THE CONVERSATION (USA 1974, Francis Ford Cop- 
pola), einem Meilenstein auf dem Weg zu einer souveränen Tonspur. 
Das Sound Design von APocALYPsE Now entstand in eineinhalbjähriger 
Arbeit, anschließend wurden bis zu 200 Spuren während acht Monaten 
zusammengemischt. Unvorstellbar, dass jeder einzelne Ton nicht nur 
gesucht und aufgenommen, sondern anschließend von Hand auf Magnet- 
bändern geschnitten werden musste. Auch der Sound-Designer Ben Burtt 
hatte während eines ganzen Jahres Zeit, die Toneffekte für STAR WARS im 
Trial-and-error-Verfahren zu gestalten. 

Zeit und kreative Muße in Verbindung mit einem individualisierten 
Arbeitsprozess erscheinen als wichtige Determinanten der neuen Ästhe- 
tik. Ganz nebenbei wird hier auch deutlich, dass fortschrittliche Konzepte 
manchmal mit den bescheidensten technischen Mitteln erreicht werden 
können, wenn Ideen und Wissen genügend Freiraum erhalten, um sich 
zu entfalten, und nicht von vornherein durch ökonomische Zwänge und 
erstarrte Arbeitsmechanismen erstickt werden. 


Zur Zielsetzung und methodischen 
Vorgehensweise 


Große Teile des Publikums - aber auch Kritiker und Filmwissenschaftler — 
fassen die Tonspur als natürliche Komponente der fiktionalen Welt auf, die 
einfach da ist. 


Das Ziel meiner Arbeit ist es, 

e Konventionen und scheinbare Selbstverständlichkeiten zu durchleuchten, 

° die Funktionen der Tonspur als Bedeutungsträger zu verstehen, 

° die Achse Ton-Bild in ihrer Beziehungsvielfalt abzutasten und 

° die Tonspur als komplexe Architektur einer virtuellen Klangwelt ver- 
ständlich zu machen. 


Bildlich gesprochen, versuche ich, die Tonspuren zu zerpflücken, ihre Ele- 
mente in die Luft zu werfen, wieder einzusammeln und neu zu sortieren. 
Mein Augenmerk richtet sich dabei auf jenes Element der akustischen 
Repräsentation, das bis heute nur wenig beachtet wurde: das Geräusch. 

In der Alltagssprache benützt man Ausdrücke wie Ton, Geräusch, 
Klang, Schall, um akustische Ereignisse zu benennen. Dieser Sprachge- 
brauch, von dem ich mich nicht grundsätzlich distanzieren will, ist auch 
in der Wissenschaft sehr uneinheitlich. Zusätzlich besteht das Problem, 
dass ein großer Teil der Texte in englischer Sprache abgefasst ist oder sich 
an englischsprachigen Publikationen orientiert, in denen der Begriff noise 
nicht nur Geräusch, sondern auch Rauschen oder Lärm bedeuten kann. 
Unter Klang versteht man sowohl die Klangfarbe (timbre) als auch die har- 
monische Schallemission eines Objekts. Mit Geräusch ist gemeinhin ein 
akustisches Ereignis ohne musikalische Eigenschaften gemeint, dessen 
Schwingungsverhalten komplex ist, während Ton als summierender Ober- 
begriff fungiert. 

Um dieser babylonischen Sprachverwirrung zu entgehen, hat Pierre 
Schaeffer den Begriff objet sonore geschaffen, den ich im Folgenden als 
Klangobjekt übersetzen werde. Das Klangobjekt wurde von Schaeffer so 
definiert: 
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Als Klangobjekt bezeichne ich hier den Ton selbst, seine akustische Beschaf- 
fenheit und nicht das materielle Objekt (ein Instrument oder eine andersge- 
artete Quelle), von dem es stammt.! (Schaeffer 1966: 23, 97) 


Die Konturen des Klangobjekts sind zwar durch physikalische Parameter 
bestimmt. Dennoch bedarf es der mentalen Tatigkeit, um es zu entdecken. 
R. Murray Schafer (1977: 274) nennt es den kleinsten abgeschlossenen Par- 
tikel einer Lautsphäre. Lautsphären, wie sie uns im Alltag ständig umflu- 
ten, sind aus vielen einzelnen Klangobjekten zusammengesetzt, die einan- 
der überlagern, folgen oder bedingen. Zieht man die Parallele zur Sprache, 
lässt sich das Klangobjekt mit dem Wort vergleichen. 

Je länger und intensiver man sich mit dem Klangobjekt befasst, desto 
schwieriger wird es, eine sinnvolle und einheitliche Grenze zwischen 
Klang und Geräusch zu ziehen. Alle formalen Definitionen, die entweder 
auf physikalischen? oder auf kulturellen? Aspekten beruhen, werden bei 
genauer Betrachtung durch Gegenbeispiele infrage gestellt. Ich bevorzuge 
aus diesem Grund eine weit gefasste Auslegung. Mit den Einzelheiten die- 
ser Begrifflichkeit werde ich mich immer wieder beschäftigen, sodass das 
Konzept Klangobjekt am Ende der Lektüre schärfere Konturen aufweisen 
wird. 

Die Funktionen des Klangobjekts in der kinematografischen Reprä- 
sentation habe ich am Beispiel des zeitgenössischen nordamerikanischen 
Mainstreamfilms untersucht. Dazu wurde ein Korpus (> 461) von 94 Fil- 
men zusammengestellt, die zum überwiegenden Teil aus der Mainstream- 
Produktion stammen. Folgende Kriterien haben zu einer Versachlichung 
der Auswahl beigetragen: die Berücksichtigung aller Filme, denen ein 
Academy Award (Oscar) für den besten Ton oder Tonschnitt zugesprochen 
wurde, sowie des tonsprachlich neutralen Genres biografischer Film (Bio- 
pic)‘; tonsprachlich neutral ist es insofern, als dort die Reizdimension des 
Klangs weniger im Vordergrund steht als in den suggestiven, primär auf 
Spannungsmaximierung hin komponierten Tonspuren von Science-Fic- 


1 «Par objet sonore nous désignons ici le son lui-même, considéré dans sa nature sonore, 
et non pas l'objet matériel (instrument ou dispositif quelconque) dont il provient.» 

2 Mit den physikalischen Unterscheidungsmerkmalen zwischen Klang und Geräusch 
befasse ich mich eingehend im Kapitel Frequenz (— 192), weil zu einer fundierten Dis- 
kussion Grundlagen nötig sind, die ich im Lauf dieses Textes bereitstellen werde. 

3 Kulturell determinierte Aspekte hängen mit der Musikpraxis zusammen. Die Vorstel- 
lungen davon, was ein Klang ist, sind beispielsweise in der westlichen Kultur seit rund 
hundert Jahren einem galoppierenden Wandel unterworfen. Einzelheiten werde ich im 
Kapitel Musikalisierung der Tonspur (> 264) zur Diskussion stellen. 

4 Parallel zu meiner Arbeit lief am Zürcher Seminar für Filmwissenschaft ein vom 
Schweizerischen Nationalfonds unterstütztes Forschungsprojekt von Henry Taylor 
zum biografischen Film. 
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tion- und Actionfilmen sowie dem Thriller. Im Hinblick auf die Behand- 
lung verschiedener Genres ergibt sich dennoch eine Konzentration auf 
die extrem suggestiv operierenden Gattungen, weil ihre Tonkreationen 
seit Ende der 1970er-Jahre überproportional mit Academy Awards bedacht 
werden. 

Den Academy Award werte ich nicht als Gütesiegel oder Qualitäts- 
merkmal. Vielmehr spiegelt sich darin der zeitbedingte Qualitätsbegriff 
einer Mehrheit jener Personen, die in der nordamerikanischen Filmindus- 
trie tätig sind. Somit werden über die Analyse dieser Filme und ihrer Ton- 
spuren Tendenzen jenes sich wandelnden Qualitätsbegriffs fassbar. Da 
der Umbruch Mitte der 1970er-Jahre vor allem von den Vertretern des 
New Hollywood (Coppola, Spielberg, Lucas, Scorsese, Altman) ausgelöst 
wurde, habe ich ihre Filme vermehrt in die Untersuchung einbezogen. 
Aus der Periode von 1975 bis 1995 stammen 41 Filme. Zusätzlich habe ich 
rund 53 Filme aus der Zeit von 1927 bis 1960 untersucht. Dieser historische 
Abschnitt dient sozusagen als Folie, auf deren Hintergrund die neueren 
Entwicklungen sichtbar werden sollen. Auch in diesem Zeitraum sind 
möglichst alle Oscar-Preisträger vertreten, soweit sie heute noch zugäng- 
lich sind. 

Die Parameter, die ich zur Datenbankanalyse verwendet habe, gehen 
auf meine Abschlussarbeit zurück. Dort entwickelte ich die Grundlagen 
zur analytischen Beschäftigung mit der Tonspur, die ich seither in ver- 
schiedenen Seminaren zur Diskussion gestellt und weiter ausgebaut habe. 
Dabei habe ich diese Arbeit als eine Reihe falsifizierbarer Thesen betrach- 
tet, die über die exakte Erforschung eines größeren Korpus zu erhärten, zu 
konkretisieren oder zu modifizieren waren. 

Die Klanglichkeit wird wahrscheinlich deshalb so häufig aus der 
theoretischen Beschäftigung mit der Tonspur ausgeblendet, weil es dazu 
nicht nur ein geschultes Ohr, sondern auch ein gewisses Maß an natur- 
wissenschaftlichem Interesse und Basiswissen braucht. Um die intuitiven 
Einsichten zu überprüfen, habe ich einzelne Klangobjekte sowie einige 
komplette Szenen im Hinblick auf Frequenzgang, spektrale Zusammen- 
setzung, Hüllkurve und rhythmische Muster mit entsprechenden Mess- 
geräten analysiert. 

In Interviews habe ich außerdem einige wichtige Exponenten der 
neuen Tonästhetik zum Verhältnis von technischer Innovation und ästhe- 
tischer Produktion sowie zur gegenwärtigen Praxis im amerikanischen 
Mainstreamfilm befragt: 


5 Nicht erhältlich waren einzig WHEN TOMORROW Comes (USA 1939, John M. Stahl) und 
THE HINDENBURG (USA 1975, Robert Wise). 
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Richard Beggs, der seit APOCALYPSE Now kontinuierlich mit Francis Ford 
Coppola zusammenarbeitet, in San Francisco; er hat mir außerdem Gele- 
genheit gegeben, ihn während einiger Tage bei seiner Arbeit an SPHERE 
(USA 1998, Barry Levinson) zu begleiten; 


Mark Mangini, der als Supervising Sound Editor Tonkonzepte fiir Disney, 
Steven Soderbergh, Walter Hill, William Friedkin und Luc Besson entwor- 
fen hat, in Los Angeles; 


Randy Thom, Sound Designer fiir Filme wie WILD AT HEART (USA 1990, 
David Lynch), Forrest Gump (USA 1994, Robert Zemeckis) oder CONTACT 
(USA 1997, Robert Zemeckis) und Dozent fiir Sound Design an verschie- 
denen universitären Institutionen, in San Francisco; 


Milan Bor, der als Mischtonmeister nicht nur die Mehrzahl aller Filme von 
Rainer Werner Fassbinder, sondern auch die großen europäischen Main- 
stream-Produktionen Das Boot (BRD 1981, Wolfgang Petersen) und THE 
NAME OF THE Rose (Frankreich/Italien/BRD 1981, Jean-Jacques Annaud) 
betreut hat, in München. 


Dank dieser Befragungen sind mir wichtige Zusammenhänge klar gewor- 
den, die ich über die Filmanalyse oder Lektüre allein nicht hätte aufspüren 
können. Neben den Interviews, die ich selber geführt habe, konnte ich auf 
Befragungen zurückgreifen, die in Sammelpublikationen oder Zeitschrif- 
ten erschienen sind. Mündliche Berichte müssen jedoch mit der detaillier- 
ten Analyse des filmischen Materials verglichen werden. Außerdem sind 
sie — das gehört zum prinzipiellen Unterschied zwischen gesprochener 
und geschriebener Sprache - selten so abgeklärt formuliert, dass generelle 
Prinzipien ohne weitergehende Reflexionen daraus ersichtlich würden. 
An schriftlichen Quellen habe ich Tagungsberichte und Firmengeschich- 
ten in die Untersuchung einbezogen. 

Obwohl in den letzten zwei Jahrzehnten mehrere wissenschaft- 
liche Texte zu Aspekten des Filmtons erschienen sind,‘ fehlt nach wie 
vor eine übergeordnete Theorie. Die meisten Publikationen befassen 
sich mit Teilaspekten, ohne die Interaktion zwischen den verschiedenen 
Elementen der Tonspur zu berücksichtigen. Das Geräusch als Klang- 
objekt wird nur marginal gestreift. Auch neueste Veröffentlichungen 


6 Ich verzichte in dieser Einleitung auf eine detailliertere Darstellung des heutigen For- 
schungsstands, weil das theoretische Einzugsgebiet zu groß ist. Ich halte es deshalb für 
sinnvoller, die Publikationen im Verlauf der Arbeit an den entsprechenden Stellen ein- 
zubeziehen. 
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sparen die Entwicklungen der letzten zwanzig Jahre mehrheitlich aus 
und orientieren sich entweder am klassischen Hollywoodfilm oder am 
europäischen Kunstfilm bis zu den 1960er-Jahren. Außerdem steht fast 
ausschließlich der semantische Aspekt im Zentrum des Interesses, wäh- 
rend sowohl klangliche als auch narrative Komponenten vernachlässigt 
werden. 

Das fachliche Einzugsgebiet dieser Arbeit erstreckt sich deshalbweit 
über die Filmtheorie hinaus. Aufgrund des spezifischen Theorievaku- 
ums habe ich auf Grundlagen aus verschiedenen Disziplinen zurück- 
greifenmüssen. Es sind dies Erkenntnisse aus der Psychoakustik und der 
Wahrnehmungspsychologie, elementare physikalische Gesetzmäßigkei- 
ten der Schallausbreitung, -aufzeichnung und -wiedergabe, weiter neu- 
ere semantische Theorien, die sich am neuropsychologischen Modell der 
konnektionistischen Netze orientieren, sowie erzähltheoretische Kon- 
zepte aus der Film- und Literaturwissenschaft. Diese Gebiete berühren 
sich nur punktuell und entbehren einer umfassenden Metatheorie. 

Um nun die potenzielle Uferlosigkeit eines solchen interdiszipli- 
nären Layouts einzudämmen, baue ich die verschiedenen Grundlagen, 
selektiv und ökonomisch auf den Kontext zugeschnitten, in den Text- 
fluss ein. Auf weitergehende Informationen, die direkt an diese Themen 
anschließen, weise ich in den Literaturempfehlungen hin. Der Aufbau 
der Arbeit trägt dem weit gestreuten methodischen Instrumentarium 
Rechnung. Im Stil eines Handbuchs werden die Themen komplett und 
in sich abgeschlossen so behandelt, dass jeweils die theoretische Basis 
in direkter Nachbarschaft zu den entsprechenden Forschungsergebnis- 
sen ausgebreitet wird. Ausgehend von diesem Konzept gliedert sich die 
Arbeit in fünf Teile mit folgenden thematischen Schwerpunkten: 


° Der erste Teil, Prämissen, beinhaltet zwei vorbereitende Kapitel, die sich 
mit den technischen Entwicklungen und Formaten sowie dem Trans- 
formationsprozess der Tonaufzeichnung im Zeitalter der virtuellen 
und abstrakten Klangproduktion befasst. 

° Die semantischen Dimensionen des Klangobjekts stehen im Zentrum 
von Teil 2: Aspekte der Bedeutung. Dazu gehören die Identifikation von 
Klangobjekten, die Ton-Bild-Beziehung sowie semantische Systeme hö- 
herer Ordnung - die sogenannte Superzeichenbildung wie Leitmotive, 
Symbole oder Stereotypen. 

° Der dritte Teil, Klanglichkeit, umfasst die psychoakustischen Merkmale 
der Verarbeitung von einzelnen Reizdimensionen, die Wahrnehmung 
komplexer Klangmuster, unter den Gesichtspunkten Aufmerksamkeit 
und Selektion bis hin zur Untersuchung der kompositorischen Arbeit 
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mit dem Klangmaterial auf der Tonspur, den Techniken der Verfrem- 
dung und der Musikalisierung. 

Im vierten Teil stelle ich einige Narrative Funktionen der Klangobjekte 
vor: die Orientierungsfunktion der Tonspur fiir die Definition von geo- 
grafischen, sozialen und kulturellen Settings; die Verwendung spezi- 
fischer klingender Materialien — hauptsächlich Wasser, Metall, Wind 
und Glas - zur Darstellung der Figur-Umwelt-Relation und schließlich 
die zahlreichen fein abgestuften Subjektivierungen, welche die Ton- 
spur oder einzelne ihrer Teile aus der Wahrnehmungsperspektive von 
Filmfiguren darstellen. 

Teil 5, Modellanalysen, schließlich beschreibt mit dem erarbeiteten 
analytischen und begrifflichen Instrumentarium drei verschiedene, 
komplementäre Gestaltungsstrategien anhand von drei ausgewählten 
Szenen aus dem Korpus. 


I Prämissen 


1 Entwicklungslinien der Tontechnik 


Die Entwicklung des Lichttons 


Die zweite Hälfte des 19. Jahrhunderts war eine Zeit intensivster For- 
schung; die Resultate dieser Forschung waren bahnbrechende Erfindun- 
gen. Mit der Säkularisierung der Gesellschaft waren einige Tabus ver- 
schwunden, welche die Beschäftigung mit dem menschlichen Körper 
und mit der menschlichen Psyche einschränkten oder verhinderten. Die 
Psychophysiker Helmholtz und Fechner betrieben Psychologie als Natur- 
wissenschaft und beschäftigten sich mit dem Verhältnis zwischen Reiz 
und Empfindung. Indem sie die materiellen Grundlagen des Wahrneh- 
mungssystems erforschten, schufen sie auch die Möglichkeit, gewisse 
Reaktionsweisen gezielt zu nutzen. Zu den Anwendungsgebieten der psy- 
chophysischen Einsichten gehören die Gedächtnis- und Wahrnehmungs- 
technologien, als welche man die Ton- und Bildspeicherung - also auch 
das Kino - auffassen kann. Als weitere Grundlage der technologischen 
Entwicklungen müssen die naturwissenschaftlichen Einsichten in die 
Mechanismen von Schall- und Lichtausbreitung gelten, die sich ebenfalls 
seit Mitte des 19. Jahrhunderts erheblich veränderten. Im Rahmen dieser 
wissenschaftlichen Umwälzungen haben eine Reihe von Forschern sehr 
unterschiedliche Ansätze zur Speicherung von akustischen Ereignissen 
verfolgt. 

Die fotografische Aufzeichnung von Schallwellen, die man allgemein 
als Lichtton bezeichnet, hat eine besonders stürmische und von vielen 
Faktoren beeinflusste Geschichte, deren Grundzüge ich kurz skizzieren 
werde. Lichtton ist bis in die Neuzeit das gebräuchlichste Verfahren zur 
Schallspeicherung auf der Filmkopie. Zunächst hatten sich zwei Verfah- 
ren parallel entwickelt, die sogenannte Sprossenschrift (variable density) 
(Abb. 1), welche die Tonmodulation durch unterschiedliche Grauwerte 
aufzeichnet, und die Zackenschrift (variable area) (Abb. 2), bei der nur die 
Zustände geschwärzt oder nicht geschwärzt unterschieden werden, die sich 
in Abhängigkeit von der Modulation vertikal zur Laufrichtung des Films 
in der Breite verändern. Aus Gründen der technischen Optimierung hat 
sich aus der Zackenschrift die Doppelzackenschrift entwickelt, bei der 
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1 35-mm-Kopie mit Sprossenschrift 2 35-mm-Kopie mit Doppelzackenschrift 


das Zackenmuster symmetrischgespiegelt aufgezeichnet wird. Im Lauf 
der Zeit hat die Zackenschrift die Sprossenschrift abgelöst und völlig zum 
Verschwinden gebracht. Die Veränderungen der Breite kommen bei der 
Zackenschrift dadurch zustande, dass sich entweder eine Blende oder ein 
Spiegel in Abhängigkeit vom Tonsignal bewegt und damit einen unter- 
schiedlich großen Bereich der Lichttonspur belichtet. 

Als Forscherin ist man bei der intensiven Beschäftigung mit den elek- 
troakustischen Entwicklungen von den teilweise bis 70-jährigen Latenz- 
perioden, die zwischen den technologischen Entdeckungen und ihrer 
Nutzung bestehen, überrascht. Die marxistisch orientierte Interpretation 
solcher Verzögerungen als ideologisch begründete Regulierungsmaß- 
nahmen des Kapitals (z.B. Comolli 1971f.) greift sicher zu kurz. In eini- 
gen Fällen haben ökonomische Faktoren Ideen vernichtet oder zumindest 
ihre massenhafte Verbreitung verhindert; viele Erfindungen waren jedoch 
nicht mehr als Keimzellen einer funktionierenden Technologie. Diese 
Interpretation trifft besonders auf die vergleichsweise späte Einführung 
des Tonfilms zu. Denn die Schwierigkeit, ein markttaugliches Kinoton- 
system zu entwickeln, lag darin, dass ein solches System aus sehr unter- 
schiedlichen Komponenten besteht, von denen jedes einzelne ausgereift 
sein muss: 


1. Aus einer Aufnahmeapparatur mit einer Wandlerkette, zum Beispiel 
einem Mikrofon oder einem Trichter, kombiniert mit einem elektro- 
optischen Wandler, einem magnetischen Aufnahmekopf oder einem 
Stichel zum Schneiden von Schallplatten 

2. einem Aufzeichnungsträger, zum Beispiel einem Filmstreifen, einem 
Magnetband oder einer Schallplatte 

3. einer Wiedergabeapparatur mit einem Transportmechanismus und 
einem adäquaten Wandler: einer Fotozelle, einem Tonkopf oder einer 
Abtastungsnadel 

4. einem Verstärker 
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5. einem Beschallungssystem mit einem oder mehreren Lautsprechern 
6. und eventuell einer Synchronsteuerung bei Systemen mit getrennten 
Trägern für Bild und Ton. 


Manche dieser technischen Voraussetzungen bestanden 1926, als die ameri- 
kanische Filmindustrie den Ton einführte, schon seit Jahrzehnten. Das Ver- 
stärkerproblem und die Schwierigkeit, Aufnahme- und Wiedergabemaschi- 
nen exakt zu koppeln, blieben hingegen bis Ende der 1910er-Jahre bestehen. 

Als Erster meldete der Franzose Eugene Augustin Lauste 1906 ein 
fast komplettes System zum Patent an (Kellogg 1955: 177; Jossé 1982: 
110 ff.). Lauste, der von 1887-1892 ein Mitarbeiter Edisons war, griff auf 
die Basisideen von Bell und Tainter zurtick, die bereits 1885 Schallwellen 
fotografisch auf eine sich drehende Glasplatte aufzeichneten, auf der eine 
bewegliche Düse in Abhängigkeit von der Schallmodulation Tinte verteilte 
und damit einen stetig einfallenden Lichtstrahl partiell abdeckte (Kellogg 
1955: 175). Lauste löste auch bereits das Problem, dass der Lichtton im 
Gegensatz zum Bild kontinuierlich transportiert werden muss, mittels 
einer frei liegenden Schleife. Zu diesem Zeitpunkt fehlten jedoch sowohl 
ein potenter Verstärker als auch elektrisch gespeiste Lautsprechersysteme. 
Ein belgischer Bankier, der sich für Laustes Forschung interessierte, unter- 
breitete das Vorhaben 1912 Ernst Ruhmer. Ruhmer war Privatdozent an 
der Technischen Universität Berlin und hatte 1901 als Nebenprodukt sei- 
ner Forschungen auf dem Gebiet der drahtlosen Telegrafie einen Mecha- 
nismus zur fotografischen Aufzeichnung von Schallwellen erfunden. 
Ruhmer starb 1913, und als 1914 der Krieg ausbrach, verarmte Lauste und 
musste sein Projekt aufgeben. 

Ende der 1910er-Jahre setzte zwischen verschiedenen Erfindern ein 
regelrechter Wettbewerb ein.' Hauptakteure des Wettstreits waren die 
deutschen Erfinder Hans Vogt, Dr. Jo Engl und Joseph Massolle, die sich 
1918 zusammenschlossen. Die Erfindergruppe, die unter dem Namen 
Triergon bekannt ist, verfügte um 1921 über ein vorführbereites Licht- 
tonverfahren. Am 26. Februar 1921 produzierten sie einen ersten kleinen 
Tonfilm, in dem die Schauspielerin Friedel Hintze Goethes Gedicht vom 
«Heidenröslein» sprach. Sie stellten ihn wenig später einem ausgewähl- 
ten Publikum von Finanziers vor, darunter Samuel Goldwyn, der «rest- 
los entzückt» gewesen sein soll (Jossé 1982: 145). Schon im nächsten Jahr, 
am 17. September 1922, «konnten sie endlich nach harter, unermüdlicher 


1 Es würde zu weit führen, die Patentstreitigkeiten und wirtschaftlichen Veränderun- 
gen an dieser Stelle auszubreiten. Sie sind im Detail nachzulesen bei Geduld (1975), 
Gomery (1975, 1980) und Jossé (1982). Eine sehr übersichtliche tabellarische Chronolo- 
gie findet sich in Icart (1988). 
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Arbeit einem auserlesenen, begeisterten Publikum in einer zweistündigen 
Matinee im größten Berliner Kino — dem Alhambra - den ersten Lichtton- 
film der Welt vorführen» (Webers 1981: 124). Das Programm, abgedruckt 
in Jossé (1982: 160 f.), bestand aus einer Serie von Werken der klassischen 
Musik, einigen Szenen aus einem Theaterstück und einer Humoreske. 
Laut zeitgenössischen Ohrenzeugenberichten waren Reinheit und Klang- 
farbe der Sprache ausgezeichnet. Die Triergon-Gruppe hatte nicht nur ein 
verbessertes Mikrofon, das sogenannte Katodophon,’ sondern auch einen 
elektrostatischen Lautsprecher (Schildbach 1993: 111) entwickelt. Die UFA 
erwarb eine Option auf das Patent. Sie scheiterte jedoch im Dezember 1925 
mit der 20-minütigen Verfilmung des Andersen-Märchens Das Mädchen 
mit den Schwefelhölzern im Kino. Die Presse kritisierte die ungenügende 
Klangqualität. Josse (1982: 208) führt dieses Scheitern auf die zu kurze 
Produktionszeit von weniger als einem Monat zurück. Eine weitere Mög- 
lichkeit ist jedoch, dass die technische Qualität den Anforderungen nicht 
genügte, die das Publikum an die Darstellung von Fiktion stellte.’ 

Im Umfeld der Inflation war die deutsche Wirtschaft nicht in der 
Lage, eine so risikobeladene Entwicklung weiterzubetreiben. Eine Schwei- 
zer Finanzgruppe erwarb 1927 die amerikanischen Auswertungsrechte 
des Patents von William Fox für 50.000 Dollar. In der Zwischenzeit hatten 
die amerikanischen Erfinder Theodore Case und Earl Sponable, basierend 
auf Grundlagenforschungen von Lee de Forest, ein Lichttonsystem ent- 
wickelt, das dem Triergon-Verfahren in vieler Hinsicht überlegen war. Die 
Patentstreitigkeiten über die Pionierleistung der Triergon-Gruppe drehten 
sich deshalb am Ende nur noch um das gewichtete Schwungrad, das den 
Gleichlauf des Films am optoelektrischen Wandler verbesserte. 


Umbruch zum Tonfilm 


Interessanterweise war es schließlich kein Lichtton-, sondern ein soge- 
nannter Nadeltonfilm, mit welchem den Warner Brothers 1926 der Durch- 
bruch zur Tonfilmära gelang. 

Das Vitaphone genannte System war eine Weiterentwicklung des Ton- 
bildsystems, das um die Jahrhundertwende bis 1913 vor allem in Europa 
verbreitet war.’ Es verband einen Plattenspieler mit dem Projektor. Im 


2 Exakte Beschreibung der frühen Mikrofontechnologie bei Weiss (1993: 40 ff.) 

3 Die Glaubwürdigkeit von Fiktion ist wesentlich brüchiger als die Glaubwürdigkeit 
von Dokumentation. Mit diesem Problem werde ich mich im Kapitel Abbildung (> 84) 
eingehend auseinandersetzen. 

4 Ausführliche Darstellung der Tonbildzeit bei Jossé (1982: 45 ff.). 
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Gegensatz zu den Tonbildern der Frühzeit basierte das System durchge- 
hend auf einer elektroakustischen Aufnahme, Verstärkung und Wieder- 
gabe. Die Frequenz des Wechselstromnetzes steuerte Plattenspieler und 
Projektor und garantierte eine exakte Übereinstimmung ihrer Laufge- 
schwindigkeit. Klanglich war das Vitaphone-System dem Lichtton über- 
legen. Kellogg (1955: 180) gibt für 1926 einen linearen Frequenzgang bis 
maximal 5kHz an. Ein weiterer Vorteil war die Möglichkeit, handelsüb- 
liche Plattenspieler im Kino zu installieren, die lediglich leicht modifiziert 
werden mussten. 

1931 gab auch Warner Brothers das Nadeltonverfahren auf. Des- 
sen größter Nachteil waren die Einschränkungen bei der Aufnahme. Die 
Schallplatten konnten nicht geschnitten und die Szenen mussten mit meh- 
reren Kameras gleichzeitig gedreht werden, um verschiedene Einstellun- 
gen zu erzielen. Die Tonaufnahme bestimmte diktatorisch Rhythmus und 
Tempo. Zwar unternahm man später Versuche, Ausschnitte zu überspie- 
len, um mehr Freiheit bei der Gestaltung des Ablaufs zu gewinnen. Diese 
Methode hatte aber den Nachteil, dass sich das Grundrauschen verdop- 
pelte. Eine weitere Krisenzone von Vitaphone war die Empfindlichkeit der 
damals üblichen Schellackplatten, die zerbrechen konnten und oft schon 
nach 20-maligem Abspielen deutlich hörbare Verschleißerscheinungen 
zeigten. 

Zwischen 1927 und 1931, als der Tonfilm in Hollywood eingeführt 
wurde, vollzog sich ein dynamischer Systemwechsel von kaum vor- 
stellbaren Ausmaßen. Die Beurteilung dieser Umstellung ist kontrovers. 
Neuere Publikationen (Jossé 1982, Thompson/Bordwell 1993) — beein- 
flusst von den exakten Recherchen des Wirtschaftshistorikers Douglas 
Gomery (1975) — entwerfen das Bild einer Filmindustrie, welche sich zur 
Vermeidung großer ökonomischer Opfer zu einer seltenen Einheit zusam- 
menschloss und den Übergang schnell und gezielt durchführte. Kellogg 
(1955) hingegen fokussiert auf das Chaos diversester Systeme und die 
Orientierungslosigkeit der Techniker, Regisseure, Schauspieler und Dreh- 
buchautoren, die unter größtem Zeitdruck und ohne Erfahrung plötzlich 
ein neues Medium aus dem Boden stampfen mussten. Fielding (1980: 20) 
berichtet — gestützt auf eine Aussage des Erfinders Earl Sponable -, dass 
Ende 1929 234 verschiedene Systeme in Gebrauch waren. 

In Wirklichkeit werden beide Auffassungen zutreffen: Aus histori- 
scher Distanz scheint die Entwicklung zwischen 1927 und 1931 unglaub- 
lich schnell fortgeschritten zu sein. Auf der operationalen Ebene gab es ein 
eindeutiges Ziel, die flächendeckende Ausbreitung des Tonfilms, und eine 
gut ausgebaute wirtschaftliche Struktur, das Studiosystem, das sich bereits 
im Lauf der 1920er-Jahre konsolidiert hatte. Völlig anders muss die Situa- 
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tion an der Basis — auf der Seite von Regisseuren, Technikern und Schau- 
spielern — gewesen sein. Die technische Entwicklung einer Apparatur zur 
Aufnahme und Wiedergabe von Schallwellen war zwar so weit vorhan- 
den. Die neue Erfindung in ein bereits sehr ausgereiftes ästhetisches Sys- 
tem mit ausdifferenzierten Codes zu integrieren, bildete hingegen eine 
extreme Herausforderung. 

Im Zentrum des Orkans stand der Toningenieur, der seine Erfahrung 
im Rundfunk oder in den Laboratorien der Telefon- und Telegraphgesell- 
schaften gesammelt hatte und nun in die Filmindustrie verpflanzt wurde. 
Der Regisseur Frank Capra (1980: 78 f.) berichtet aus eigener leidvoller 
Erfahrung: «Der Tonmann war damals eine echte Primadonna. [...] Er 
trug immer riesige Kopfhörer und bestand darauf, dass seine Ohren jeden 
Tag um vier Uhr vom Arzt ausgespült wurden.»® Kameramann Hal Mohr 
(1980: 71): «Wir waren schrecklich eingeschüchtert von den neunmalklu- 
gen Experten, die in unsere Studios kamen, um uns zu erklären, wie wir 
unsere Stummfilme vertonen sollten.[...] Der Tonmann war damals die 
oberste Gottheit auf dem Set.»° 

Die Arbeitsabläufe wurden durch die Einführung des Tons empfind- 
lich gestört. Regisseure und Techniker mussten plötzlich in Grabesstille 
arbeiten. Kameramann und Kamera wurden während der Aufnahme in 
ein großes, schalldichtes Gehäuse gesperrt. Die Aufzeichnung des Tons 
erforderte sowohl eine konstante, als auch eine auf 24 Bilder pro Sekunde 
erhöhte Geschwindigkeit. Die größere Geschwindigkeit hatte eine kürzere 
Belichtungszeit zur Folge, das erforderte 50% mehr Licht und erzeugte 
entsprechend mehr Hitze am Set. Die Kohlebogenlampen, die bis dahin 
üblich waren, mussten ersetzt werden, da sie brummten. Das neue Glüh- 
licht war nicht kompatibel mit den orthochromatischen Emulsionen, die 
nur für die Wellenlängen von grünem und blauem Licht empfindlich 
waren. «Auf der panchromatischen Emulsion mussten wir zum roten 
Ende des Spektrums gehen. [...] Das bedeutete für uns Stummfilm-Kame- 
raleute, dass wir es eigentlich mit einem neuen Medium zu tun hatten» 
(Mohr 1980: 74). Panchromatisches Filmmaterial, das für alle Wellenlän- 
gen des sichtbaren Lichts gleichermaßen empfindlich ist, und die verän- 


5 «The sound man at that time was one of the biggest prima donnas you have ever seen. 
[...] He always wore enormous headphones on his ears, and insisted that he had to 
have his ears washed out by doctor every day at 4 o’clock.» 

6 We were terrifically awed by the eggheads who came onto our stages to tell us how we 


were going to put sound on our silent films. [...] The sound man at that time had been 
the supreme god on the set. 
7 We had to go to the red end of the spectrum on a panchromatic emulsion [...]. So here 


we were working with a new medium as far as we, the silent cameramen, were con- 
cerned. 
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derte Beleuchtungstechnik bedingten eine andere Schminktechnik, andere 
Kostüme und eine andere Ausstattung. Alle Farben wirkten anders auf 
dem neuen Schwarz-Weiß-Film. Auf lange Sicht war das neue Material 
dem alten überlegen. Andere Verbesserungen, wie feineres Korn und dif- 
ferenziertere Grauwerte, wurden ebenfalls durch die Einführung des Tons 
forciert.® 

Die frisch gegründete Academy of Motion Picture Arts and Sciences 
führte Seminare für Tontechniker durch. Daraus ging eine Publikation 
hervor, die für die folgenden Überlegungen zur Tonästhetik der Früh- 
phase die wichtigste Quelle darstellt — Recording Sound for Motion Pictu- 
res —, eine Sammlung von praktischen Anleitungen kombiniert mit techni- 
schen, physikalischen und psychophysischen Hintergrundinformationen, 
1931 von Lester Cowan herausgegeben. Weitere Darstellungen, die mit 
profunder technischer und physikalischer Kenntnis verfasst wurden, sind 
Kellogg (1955), ursprünglich erschienen im Journal of SMPTE (Society of 
Motion Pictures and Television Engineers), abgedruckt in Fielding (1967), 
und in Deutsch: 50 Jahre Stereo-Magnetbandtechnik. Die Entwicklung der 
Audio-Technologie in Berlin und den USA von den Anfängen bis 1943, heraus- 
gegeben von der Audio Engineering Society AES (1982). Der Rückgriff auf 
solche technisch detaillierten Darstellungen hat den Vorteil, einige Fall- 
strickekonventioneller Filmgeschichtsschreibung zu umgehen. In erster 
Linie präsentiert die Sammlung von Cowan die überraschende Einsicht, 
dass die technische Entwicklung 1931 bereits vollständig ausdifferenziert 
war und sich seit Beginn an der auditiven Wahrnehmung des Menschen 
orientierte. 


Klanglichkeit des frühen Tonfilms 


Die Klanglichkeit einer Tonaufzeichnung ist das Resultat verschiedener 
Faktoren technischer und ästhetischer Art, die einander bedingen. Ihre 
technische Basis ist die Qualität auf jeder Stufe der Aufzeichnung und 
Wiedergabe. Die Grundbegriffe Auflösung und Dynamikumfang bestimmen 
die Eckdaten, innerhalb derer eine ästhetische Aufbereitung stattfinden 
kann. Auflösung meint die Feinheit und Präzision im Erfassen von klang- 
lichen Details. Sie ist eine Funktion des Frequenzgangs und des Signal- 
Rausch-Abstands aller Komponenten. Unter Dynamikumfang versteht man 
die Bandbreite der zur Verfügung stehenden Lautstärke. Sie ist ebenfalls 


8 Im Gegensatz zu den Berichten von Zeitzeugen und den Darstellungen in damaligen 
technischen Publikationen weist Salt (1983: 179 ff.) darauf hin, dass dieser technische 
Umbruch teilweise vor Einführung des Tonfilms auf Betreiben des Herstellers East- 
man Kodak begann. 
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eine Funktion des Signal-Rausch-Abstands und der Kapazitat aller Ele- 
mente vom Mikrofon über das Aufzeichnungsmedium bis zum Lautspre- 
cher. Das schwächste Glied ist ausschlaggebend für die Maximalwerte 
der gesamten Kette von der Aufnahme bis zur Wiedergabe. Die kritischen 
Elemente zu Beginn der Tonfilmära waren der Lichtton und das Mikrofon 
sowie die fehlenden Schnittmöglichkeiten in den ersten Jahren. 

Warren (in LoBrutto 1994: 131) vergleicht den Lichtton mit einer 
Schüssel voll Wasser. Ein einzelner Tropfen kann die Schüssel zum Über- 
laufen bringen. Ähnliches geschieht bei Übersteuerung: Wenn der Maxi- 
malpegel erreicht ist, verträgt der Lichtton keine noch so minimale Stei- 
gerung mehr. 

Zu der begrenzten Kapazität, einem generellen Problem des Licht- 
tons, kamen in den 1920er-Jahren das wesentlich stärkere Grundrauschen 
und ein eingeschränkter Übertragungsbereich hinzu, der bis maximal 
6000 Hz reichte. Beide Probleme resultierten aus ungleichmäßigen, grob- 
körnigen Emulsionen und Streulicht. Für die Sprossenschrift (variable den- 
sity) kam eine exakte Abstimmung der Grauwerte beim Entwicklungs- 
prozess dazu. Die Zackenschrift (variable area) war von der Qualität des 
Galvanometers abhängig, der die Bewegung des Spiegels oder der Blende 
in Abhängigkeit vom Tonsignal steuerte (Kellogg 1955: 194 ff.). 

Um die Qualität der Mikrofone diskutieren zu können, bedarf es erst 
einer kurzen technischen Erklärung, denn hier werden häufig die Resul- 
tate von Arbeitsprinzip und Richtcharakteristik miteinander verwechselt. 
Arbeitsprinzip bedeutet die Art und Weise, wie die Schwingungen der 
Membran in elektrische Impulse gewandelt werden. Es gibt hauptsächlich 
zwei Gruppen: Kondensatormikrofone und dynamische Mikrofone. Unter dem 
Oberbegriff dynamische Mikrofone werden Tauchspulen- und Bändchen- 
mikrofone zusammengefasst. Klanglich sind Kondensatormikrofone im 
Allgemeinen überlegen; sie werden deshalb bei der Aufnahme von Spiel- 
filmton und klassischer Musik bevorzugt. Dynamische Mikrofone sind 
robuster und verarbeiten hohe Schalldruckpegel besser; sie werden des- 
halb teilweise für Reportagezwecke und die Aufnahme von bestimmten 
Musikinstrumenten, vor allem Schlagzeug, auch heute noch eingesetzt. 
Ein zweites Unterscheidungsmerkmal ist die Richtcharakteristik, das heißt, 
die richtungsabhängige Empfindlichkeit. Sie ist ein Resultat der Bauform. 
Kondensatormikrofone können alle Typen der Richtcharakteristik aufwei- 
sen — Kugel, Niere, Keule, Acht — und sind bis heute für Filmaufnahmen 
fast ausschließlich gebräuchlich. 

Die ersten Kondensatormikrofone waren sehr schwer. Harder (1993: 
89) gibt ein Gewicht von 5 kg für Mikrofon und Vorverstärker an, Free- 
ricks (in Steen 1974: 316) spricht von 18 Pfund. Der Frequenzgang war 
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bis 10 kHz linear, also wesentlich besser als derjenige des Lichttons. Das 
Hauptproblem bildete die kugelförmige Richtcharakteristik. Sämtliche 
Störgeräusche - also auch die Geräusche von Kamera und Beleuchtung 
sowie alle Bewegungs- und Umgebungsgeräusche — wurden mit der- 
selben Genauigkeit abgebildet wie der Dialog und die Handlungen der 
Figuren. Hall und Reflexionen beeintrachtigten die Sprachverständlich- 
keit mitzunehmen dem Abstand des Mikrofons von den Darstellern über- 
proportional. Clark (1931: 123) beschreibt abenteuerliche Filztrichter zur 
Dämpfung des rückseitig einfallenden Schalls, hornförmige Gebilde mit 
radial angeordneten Helmholtz-Resonatoren zur Verstärkung spezifischer 
Sprachfrequenzen sowie Paraboltrichter, welche die direkten, frontalen 
Schallwellen an der Membran bündelten, das Einzige dieser Verfahren, 
das bis heute in extremen Situationen zur Anwendung kommt. Ab 1931 
standen die ersten dynamischen Mikrofone zur Verfügung. «Weniger 
schwer bedeutet nicht leichter. Athletische Tonmänner schwenkten seither 
vorsintflutliche Galgen über den Köpfen der Schauspieler herum»,? wie 
Bailblé (1979: [3] 51) sehr anschaulich formuliert. Das dynamische Band- 
chenmikrofon hatte eine Nierencharakteristik, verstärkte damit den fron- 
tal einfallenden Schall, während es die potenziellen Störungen von hinten 
dämpfte. 

Die Arbeit mit mehreren Mikrofonen gleichzeitig war sehr früh 
üblich. Nicht nur die Toneffekte, sondern auch die Musik wurde live in 
einem speziellen Studio eingespielt, direkt im sogenannten Aquarium — 
einer schalldichten Tonregie am Set — abgemischt (Morgan 1931: 148) und 
von der Lichttonkamera aufgezeichnet. Mamoulian (1980: 90) erzählt, 
wie die Verkehrsgeräusche im Hintergrund live aufgenommen wurden. 
Geräuschproduzenten waren hauptsächlich die Geräuschemacher, die 
ihren Einsatz per Lichtsignal bekamen (Clark 1931: 131). 

Bedingt durch diese Arbeitsmethode kam ein relativ begrenztes 
Repertoire von künstlich herstellbaren Klangobjekten zum Einsatz, wie 
René Clair bedauernd bemerkt, denen die vielfältigen Nuancen der natür- 
lichen Lautsphären fehlten. Selbst absolute Standards späterer Perioden — 
Hundegebell, Grillenzirpen, Vogelgezwitscher - fehlten. Wind und Don- 
ner, Stereotypen aus dem Theater und der Stummfilmzeit, finden sich in 
keinem der visionierten Beispiele." 


9 «Moins lourds, ça ne veut pas dire plus légers. D’athlétiques perchmen manceuvrent 
des lors de préhistoriques girafes, au-dessus des acteurs.» 

10 Folgende Beispiele aus der Frühzeit des Tonfilms habe ich für diese Arbeit analysiert 
oder visioniert, weil sie besonders innovativ mit der Tonspur umgehen: APPLAUSE 
(USA 1929, Rouben Mamoulian), HALLELUJAH! (USA 1929, King Vidor), BLACKMAIL 
(GB 1929, Alfred Hitchcock), SINFONIJA DONBASSA / ENTUZIAZM (Sowjetunion 1930, 
Dsiga Wertow), THE Bic House (USA 1930, George Hill), Sous LES Torts DE PARIS 
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Ähnlich wie visuelle Inserts, die losgelöst vom Raum-Zeit-Konti- 
nuum abstrakte Inhalte vermitteln, wurden akustische Stilisierungen ein- 
gesetzt wie beispielsweise schroffe Gegenüberstellungen (laut - leise), 
Bedeutungsübertragungen (Schrei - Hupe), expressive Überhöhungen 
(Babygeschrei plus dramatische Musik) oder auch das Trillerndes Kana- 
rienvogels für den Begriff «singen, verpfeifen» im Sinne von «denunzie- 
ren» in Hitchcocks BLACKMAIL (GB 1929). Selbst die Befindlichkeit der 
Figuren haben Pioniere des Tonfilms in kreative Konzepte umgesetzt wie 
zum Beispiel die Trunkenheit als Verlangsamung der Tonaufnahme in 
KUHLE WAMPE von Slatan Dudow (BRD 1932) oder die berühmte Szene 
aus BLACKMAIL, in welcher ein Dialog schwatzender Nachbarinnen nur 
noch aus dem Wort «knife» zu bestehen scheint. Solche ostentative, zuge- 
spitzte Formen der Zuschreibung sind heute im szenischen Mainstream- 
film nur noch als ironisierende Zitate möglich. 

Die eingeschränkten technischen Möglichkeiten hatten jedoch auch 
einen positiven Effekt, denn sie bedingten eine ausgeprägte Ökonomie auf 
der Tonspur. Jedes Element hatte eine klare erzählerische Funktion, die mit 
größter Sorgfalt aufgebaut und sinnvoll in den Kontext integriert wurde. 
Komplexe Schichtungen verschiedener Klangelemente wie in APPLAUSE 
(USA 1929, Rouben Mamoulian) waren die absolute Ausnahme. Stattdes- 
sen wurden die Klangobjekte wie Perlen auf eine Schnur hintereinander 
aufgereiht. 

Als die Eigenschaften des Lichttons sich um 1930 verbessert hatten, 
begann man, mehrere Aufnahmen zusammenzumischen. Mit feinkörnige- 
ren Emulsionen, einem Rauschunterdrückungssystem, das darin bestand, 
dass bei der Zackenschrift der weiße Grund geschwärzt wurde (Kellogg 
1955: 196f.), und dem sogenannten Push-Pull-Verfahren — der Verdop- 
pelung der Tonspur durch Addition eines Negativs (Kellogg 1955: 197) — 
erreichte man einen besseren Signal-Rausch-Abstand. Eine Reihe von Ver- 
suchen führte zur Entwicklung eines Ultraviolett-Filters, der die störenden 
Nebeneffekte durch Reduktion unerwünschter Lichtstreuung deutlich 
verminderte (Aldred 1981: 889). Die Mischung (re-recording) summiert 
nämlich nicht nur das Grundrauschen aller kombinierten Tonträger, son- 
dern addiert zusätzlich sämtliche Mängel des Aufnahmemediums. Mor- 
gan (1931: 150) konstatiert, dass mehrere Studios zu Beginn der 1930er- 
Jahre über die technischen Einrichtungen zur Mischung verfügen und 
die meisten Filme zu 50 bis 100% gemischt werden. Das größte Hindernis 


(Frankreich 1930, René Clair), M — EINE STADT SUCHT EINEN MÖRDER (Deutschland 
1931, Fritz Lang), KAMERADSCHAFT (Deutschland 1931, G.W. Pabst), SCARFACE (USA 
1932, Howard Hawks), BOUDU SAUVE DES EAUX (Frankreich 1932, Jean Renoir), KING 
Kong (USA 1933, Cooper/Schoedsack). 
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für die Schaffung komplexer Tonspuren war die Notwendigkeit, ganze 
Akte in einem Durchgang zu mischen, da die Lichttonkamera während 
der Aufnahme nicht gestoppt werden konnte (persönliche Mitteilung von 
Paul Schöler, vormals Mischtonmeister der Bavaria in München). Wie 
Aldred (1981) schreibt, hatte die große Anzahl von Probedurchgängen, die 
deshalb nötig war, zur Folge, dass die Originalaufnahme zerkratzt und 
schmutzig wurde, was wiederum zu einer Verstärkung des Rauschens 
führte. «Zu Beginn stellten die Originalaufnahme und vielleicht ein oder 
zwei Effektspuren (normalerweise war es nur eine) und ein oder zwei 
Musikspuren das Maximum für die Mischung dar» (Stewart 1980: 48)." 

Mit der zunehmenden Verbreitung der Mischung änderte sich die 
Tonästhetik radikal. Musik war in den Filmen von 1928 bis 1931 vorwie- 
gend szenisch motiviert, in Restaurants, Bars, in der Kirche; nun kehrte sie 
aus dem Orchestergraben des Stummfilms zurück, als so genannt extradi- 
egetische Musik." 

Dies hatte nicht nur ästhetische oder technische Gründe. Denn es 
war schon früher durchaus möglich, extradiegetische Musik live dazu zu 
mischen. Doch das hätte die Präsenz des Orchesters während der Dreh- 
arbeiten erfordert und wäre mit gigantischen Kosten verbunden gewesen 
(Brown 1994: 52). Nun konnte man die Musik kostengünstig nachträglich 
zur Projektion des fertig geschnittenen Films aufnehmen. Damit begann 
die Ära der Hollywood-Symphonik, und das Zeitalter der Experimente, 
das Interregnum, wie Jullier (1995) es nennt, ging zu Ende. «Eingeklemmt 
zwischen Dialog und einer ebenso dichten Musik, führten die Geräusche 
ein diskretes und schüchternes Dasein und wiesen mehr auf die stilisierte 
und codierte Geräuschpraxis als auf das wahre Leben hin» (Chion 1990: 
125).15 Die ausdifferenzierte Musikgestaltung dieser Ara hatte die Funk- 
tion, trotz der relativen Armut der Klangwelten atmosphärische Dichte zu 
schaffen. 


11 «In the beginning the original plus possibly one or two effects tracks (usually only one) 
and one or two music tracks represented the maximum number of tracks required on 
the dubbing stage.» 

12 Damit ist Musik gemeint, die nicht im raumzeitlichen Kontinuum der filmischen 
Handlung verankert ist, sondern von der Erzählinstanz hinzugefügt wird. Manche 
Publikationen verwenden den Begriff Underscoring. 

13 «Pris en sandwich entre des dialogues et une musique également prolixes, les bruits se 
firent alors discrets et timides, tenant plus d’un bruitage stylisé et codé que d’un véri- 
table rendu charnel de la vie.» 


Magnetton 39 


Magnetton 


Zwischen der Erfindung des Prinzips der magnetischen Schallspeiche- 
rung und ihrer kommerziellen Nutzung besteht eine frappierende Latenz- 
zeit. Oberlin Smith hatte schon 1878 «eine Vorstellung von der Nutzung 
von Elektromagnetismus zur Tonaufzeichnung» (Clark 1993: 26). 1888 
veröffentlichte er seine Ideen nach einer Reihe von Experimenten ohne 
nutzbare Anwendung. Ein erstes funktionsfähiges Magnettongerät, das 
Telegraphone, entwickelte der Däne Poulsen um 1898. «Der Informations- 
träger|...] bestand aus Stahldraht von 1 mm Q und 100 m Länge, die maxi- 
male Laufdauer betrug ca. 50 s» (Thiele 1993: 161). Stahldrahtmaschinen 
kamen in den 1920er-Jahren als Diktiergeräte auf den Markt. Die Bell-La- 
boratorien verfügten Anfang der 1930er-Jahre über ein Stahlbandsystem, 
dessen technische Spezifikationen den anderen Aufzeichnungsmedien 
überlegen waren. Die Erfindung, die für Anrufbeantworter genutzt wer- 
den sollte, wurde vom AT&T Management aus rechtlichen Gründen” 
unterdrückt. Diese Reaktion hat möglicherweise verhindert, dass die 
Filmindustrie den Magnetton früher übernahm. Denn bereits 1929 hatte 
Dr. Stille in Berlin der Fachwelt ein SepMag-Magnetfilmlaufwerk vorge- 
stellt (Thiele 1993: 163). SepMag bedeutet, dass der Schall auf ein zweites, 
ebenfalls perforiertes Band aufgezeichnet wird, das bei der Vorführung 
mit dem Bildträger synchron läuft. Damit war faktisch die Magnetfilm- 
technik erfunden. 

Die Entwicklung wurde während des 2. Weltkriegs in Deutschland 
weitergeführt. Ende 1920er-Jahre hatte der Ingenieur Pfleumer ein ers- 
tes Patent für Magnetband - bestehend aus Papier mit aufgedampftem 
Nickelbelag - erhalten (Thiele 1993: 164). Die Idee wurde von der AEG auf- 
gegriffen. Die chemischen Probleme löste die IG Farben. Mobile Magnet- 
bandmaschinen wurden bereits in den 1930er-Jahren für militärische Zwe- 
cke hergestellt. Die technischen Daten waren mäßig: Dynamik ca. 40dB, 
Klirrfaktor ca. 10%, obere Grenzfrequenz f = 5kHz (Thiele 1993: 172). Die 
Geräte taugten deshalb nicht für eine massenmediale Nutzung. 


14 Dazu steht bei Clark (1993: 29) Folgendes: «Erstens: Falls Unterhaltungen den Cha- 

rakter von Niederschriften bekommen würden, [...] würden die Kunden [...] zur Post 
zurückkehren, wo ein Versprecher sich nicht fatal auswirken würde. 
Zweitens: Falls Unterhaltungen aufgezeichnet werden könnten, würden Gespräche 
illegaler oder amoralischer Natur, deren Ausmaß von einigen Verantwortlichen auf ein 
Drittel der Gesamtgespräche geschätzt wurde, nicht mehr am Telefon diskutiert wer- 
den. Das Resultat dieses spürbaren Verlustes an Privatsphäre wäre [...] eine Minde- 
rung des Vertrauens, das die Menschen in das Telefonsystem setzten.» 
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Erst die Hochfrequenz-Vormagnetisierung, die 1941 von Weber und 
Braunmühl erfunden wurde, brachte den entscheidenden Durchbruch. 
Die HF-Vormagnetisierung überwindet die starke Nichtlinearität bei klei- 
nen Feldstärken und führt zu einer wesentlich effizienteren Ausschöpfung 
der Magnetisierbarkeit. Sie erweiterte bereits damals den Dynamikum- 
fang auf 60dB, senkte den Klirrfaktor auf 2% und vergrößerte die obere 
Grenzfrequenz auf 10kHz (Thiele 1993: 173). 


In den Tobis-Studios Berlin-Johannisthal wurden 1943 erstmalig, soweit es 
die Forderungen nach Bild-Ton-Synchronlauf erlaubten, Tontakes des Fil- 
mes DER GROSSE KONIG mit einer für HF-Vormagnetisierung umgebauten 
Magnetophon-K4-Anlage aufgenommen. Zudem begann bei der Klangfilm 
GmbH, einer Siemens-Tochter, die Entwicklung eines Commag-Recorders, 
der allerdings erst nach dem Kriege zum Magnetfilmrecorder Magnetocord 
führte. (Thiele 1993: 173) 


Bei der ComMag-Technik wird eine Magnetrandspur direkt auf den Bild- 
träger aufgetragen, sodass die Übereinstimmung von Bild und Ton auch 
nach einem Schnitt gewährleistet ist. 

Ab 1948 begannen die Hollywood-Studios umzustellen. Den größ- 
ten Widerstand leisteten die Schnittabteilungen. Sie beschwerten sich, 
dass sie im Gegensatz zum Lichtton die Tonmodulation auf dem magneti- 
schen Trägermaterial nicht mehr sehen konnten. In einer Übergangsphase 
bis circa 1954 hat man den Magnetton zur Montage deshalb auf Lichtton 
überspielt. Magnetton setzte sich trotzdem durch. Von der Aufnahme des 
Originals bis zur Mischung wurden alle produktionstechnischen Schritte 
mit Magnetton ausgeführt. Am Ende jedoch, auf der fertigen Kopie, 
wurde die Tonspur — mit Ausnahme der großen Breitwandproduktionen, 
von denen im nächsten Kapitel die Rede sein wird - auf Lichtton über- 
spielt. 

Die Magnetspeicherung war dem Lichtton in jeder Hinsicht über- 
legen. Die Klangqualität war hörbar besser, der Signal-Rausch-Abstand 
deutlich größer. Man konnte das Band einfach schneiden und zusammen- 
kleben und die Qualität während der Aufnahme kontrollieren. Ein ent- 
scheidender Nachteil der Kopien mit Magnetrandspuren war allerdings 
ihre Empfindlichkeit. Magnetrandspuren konnten gelöscht oder mit der 
Zeit abgeschabt werden. Die ökonomischen Faktoren — Magnetfilm ist für 
die Herstellung von Filmkopien teurer — und die mangelnde Praktikabili- 
tät des Systems haben während langer Zeit verhindert, dass sich Magnet- 
ton trotz seiner entscheidenden klangästhetischen Vorteile in den Kinos 
durchsetzen konnte. 
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Kinoraum, Stereo 


Die Stereofonie simuliert die Räumlichkeit des natürlichen Schalls, indem 
sie das akustische Freignis auf zwei oder mehrere Kanäle aufzeichnet und 
wiedergibt. Der Zweikanalton ist ebenso künstlich wie andere Verfahren 
der Mehrkanalaufzeichnung. Die Tatsache, dass wir über zwei Ohren ver- 
fügen, bedeutet nicht, dass man die Lautsphäre über zwei Lautsprecher 
«natürlich» oder «realistisch» abbilden kann. In der realen Welt hat jedes 
Schallereignis einen Ort, der sich in den Eigenschaften des Schalls wie Ver- 
zögerung, Frequenzgang und/oder Hallanteil niederschlägt. Die Reduk- 
tion auf zwei oder auch mehrere Lautsprecher ist deshalb eine Vereinfa- 
chung der komplexen akustischen Raumbeziehungen. Laut Holman (in 
LoBrutto 1994: 206) haben die technischen Grenzen der Schallplatte, die 
nicht mehr als zwei gleichzeitige Signale aufzeichnen kann, in den 1950er- 
Jahren zur Reduktion von drei auf zwei Kanäle geführt und damit einen 
Standard im Consumer-Bereich etabliert, der bei genauer Betrachtung 
ungenügend ist. Während Jahrzehnten waren die mehrkanaligen Verfah- 
rendes Kinotons den Stereoformaten im Heimbereich überlegen (Stetter 
1992: 271). 

Weil akustisch-räumliche Information unter ökonomisch vertretba- 
ren Bedingungen nicht durch ein beliebig dichtes Netz von Tonpunkten 
dargestellt werden kann, kommen in der Stereofonie hörpsychologische 
Ergebnisse zur Erzeugung einer eigentlich virtuellen Räumlichkeit zur 
Anwendung. Ihre psychophysischen Grundlagen werde ich im folgenden 
Einschub kurz darstellen. 


Exkurs: Auditive Ortung 


Das räumliche Hören ist der bestdokumentierte Bereich der Psychoakus- 
tik, weil Experimente zu diesem Thema relativ leicht durchzuführen sind. 
Sie verlangen von den Versuchspersonen nur Fähigkeiten, die sie auch im 
täglichen Leben anwenden. 

Zwei Parameter des Schalls sichern die Lokalisation der Schallquelle 
doppelt: die Laufzeit- oder Phasendifferenz einerseits und die Intensitäts- 
unterschiede andererseits. In der Natur treten diese beiden Effekte immer 
zusammen auf. 

Die Laufzeitdifferenz kommt dadurch zustande, dass die Wege von 
einer seitlich angeordneten Schallquelle zu den beiden Ohren unterschied- 
lich lang sind. 
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3 Für impulshaltigen Schall ist der Laufzeitunterschied eindeutig, für Dauerschall 
hingegen wird der Phasenunterschied wirksam. Er lässt sich am besten am Beispiel 
einer einfachen Sinuswelle darstellen, die wir als Projektion einer Kreisbewegung 
verstehen können, ähnlich wie die Bewegung eines Fahrradpedals während der 
Fahrt. Dabei entspricht der Abstand vom Nulldurchgang bis zum Maximum (Ampli- 
tude) einem Phasenwinkel von 90° und von Nulldurchgang bis Nulldurchgang einem 
Phasenwinkel von 180°. Die Periode umfasst die gesamte Schwingung mit 360°. 
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4 Das menschliche Ohr oder vielmehr das nachgeschaltete Analyseinstrument ist 
fahig, auch die Phasenlage wahrzunehmen. Buser/Imbert (1987) geben an, dass die 
neuronalen Impulse von den Sinneszellen, den sogenannten Haarzellen, immer nur 
im positiven Bereich abgegeben werden. 


Das Gehirn induziert den Minuswert. Die Phasenlage wird mit 
zunehmender Frequenz infolge der kleiner werdenden Wellenlange fiir 
die Ortung weniger wichtig und spielt für Frequenzen oberhalb 2 kHz 
dafür praktisch keine Rolle mehr. 
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Das zweite Arbeitsprinzip, die Verrechnung des Intensitätsunter- 
schieds, kommt dadurch zustande, dass am abgewandten Ohr, bedingt 
durch die Kopfform, ein Schallschatten entsteht. Dieser Intensitätsunter- 
schied liegt in der Größenordnung von 6 bis 12dB und nimmt aus akusti- 
schen Gründen mit höher werdender Frequenz zu (Keidel 1975: 384). 

Beide Prinzipien sind also frequenzabhängig. Für tiefe Frequenzen ist 
der Laufzeit- oder Phasenunterschied, für höhere Frequenzen dagegen der 
Intensitätsunterschied wirksamer. Deshalb ist die Ortung im Übergangs- 
bereich zwischen 2 und 4kHz am wenigsten genau (Buser/Imbert 1987: 
63f.; Yost/ Nielsen 1977: 161). 

Die Genauigkeit der Ortung hängt von der Position der Schallquelle 
ab: Sie ist dann am größten, wenn sich die Schallquelle vorne in der Mitte 
befindet, und nimmt mit zunehmender seitlicher Verschiebung ab. Der 
Reflex, den Kopf der Schallquelle zuzuwenden, ist deshalb nicht nur evo- 
lutionär, sondern auch psychophysisch bedingt. Für die Unterscheidung 
von oben und unten, hinten und vorn ist die Architektur der Ohrmuschel 
zuständig. Diese Unterscheidungsformen gründen hauptsächlich auf 
Intensitätsdifferenzen. 

Eine kuriose Spezialität der auditiven Ortung ist der sogenannte 
Haas-Effekt, der für die Beschallung von Räumen, also auch von Kinos, 
genutzt wird: Innerhalb eines Zeitraums von 50 ms bedingt die erste auf 
das Ohr auftreffende Schallwelle die Ortung auch dann, wenn innerhalb 
dieses Zeitraums ein zweiter Schall von größerer Intensität aus einer ande- 
ren Richtung auf das Ohr trifft. Das heißt praktisch: Wenn der Ton, der 
aus den seitlich angebrachten Lautsprechern im Kino erklingt, mit einer 
Verzögerung von bis zu 50 ms gegenüber dem Schall aus den vorne ange- 
brachten Lautsprechern zugeführt wird, orten wir die Schallquelle auch 
dann vorne, wenn dieser seitliche Schall lauter ist. 


Stereo im Kino 


Die Stereofonie des Kinos arbeitet überwiegend mit dem Intensitäts- 
prinzip. Hören wir denselben Ton mit gleicher Intensität aus zwei Laut- 
sprechern, wird die sogenannte Summenlokalisation wirksam. Das Gehirn 
errechnet eine Phantomschallquelle, die sich in der Mitte zwischen den Laut- 
sprechern befindet. Eine Verschiebung nach links oder rechts ist durch die 
graduelle Zuordnung verschiedener Intensitäten auf die beiden Kanäle 
möglich. Damit wird der Ortungsmechanismus des Intensitätsunter- 
schieds simuliert, den wir — wie oben beschrieben - auch im Alltag anwen- 
den. Die Wirkung tritt bei zwei Lautsprechern jedoch nur in einem sehr 
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kleinen Bereich in der Symmetrieachse auf. Die Positionierung des Hörers 
am idealen Punkt stellt im Wohnzimmer kein Problem dar. Im Kino hin- 
gegen müsste das Publikum linienförmig auf der Symmetrieachse ange- 
ordnet werden. Deshalb installierte man dort schon bei den frühen Experi- 
menten mit stereofonischem Ton einen oder mehrere Lautsprecher vorne 
in der Mitte, um den optimalen Hörbereich zu erweitern. 

Maßgeblich für die Ortung eines Klangobjekts ist — aufgrund des 
oben beschriebenen Haas-Effekts — die erste Schallwelle, die das Ohr des 
Zuhörers erreicht. Als Schallquelle wird also zunächst — unabhängig von 
den räumlichen Parametern des Kinos — der Lautsprecher wahrgenom- 
men. 

Verschiedene Faktoren beeinträchtigen die Präzision der Ortung im 
Kino, die im natürlichen Klangraum bei ungefähr 10° liegt. Die Intensi- 
tätsdifferenz ist vor allem im höheren Frequenzbereich wirksam. Weiter 
beeinträchtigt die Tatsache, dass bei der Beschallung mit Lautsprechern 
keine wirkliche Trennung zwischen den Schallkomponenten erfolgt, die 
auf das linke respektive rechte Ohrtreffen, die Genauigkeit der räumlichen 
Wahrnehmung. 

Echtes binaurales Stereo würde einschließen, dass ein Hörer mit 
sämtlichen Komponenten der Raumwahrnehmung - Laufzeit-, Phasen- 
und Intensitätsunterschiede kombiniert mit den spezifischen Verände- 
rungen des Klangs durch die Ohrmuschel - versorgt würde. Eine solche 
Technik erschließt die gesamte Raumsphäre halbkugelförmig in einem 
Panorama von 360°. Die Kunstkopfstereophonie, bei welcher die Mikrofon- 
membranen in einem nachgebauten Kopf an der Stelle des Trommelfells 
positioniert sind, kommt diesem Ideal am nächsten. Sie ist nicht für die 
Beschallung von Räumen geeignet, sondern kann ihre Wirkung nur im 
Kopfhörer entfalten. 


Geschichte und Formate 


Erste Versuche mit Stereo datieren in die 1930er-Jahre. Alan Blumlein hatte 
bereits 1931 eine Mikrofonanordnung entwickelt, um eine räumlich wir- 
kende Schallaufnahme zu realisieren. Dabei ordnete er zwei Mikrofone 
mit Achter-Richtcharakteristik über Kreuz in einem Winkel von 90° an 
(Bartlett 1991: 191)."° Ähnliche Anordnungen, die später auf der Grund- 
lage von Blumleins Überlegungen mit unterschiedlichen Richtcharakte- 


15 Unter Achter-Charakteristik versteht man eine bipolare Empfindlichkeit eines Mikro- 
fons, die man sich als eine Acht quer zur Mikrofonachse vorstellen kann. Sämtliche Ste- 
reo-Mikrofonanordnungen werden bei Bartlett (1991) aufgeführt. Bei der sogenannten 
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ristika und anderen Öffnungswinkeln weiterentwickelt wurden, sind bis 
heute als sogenannte XY- oder Koinzidenzstereofonie bei Filmtonaufnahmen 
gebräuchlich. 

Berühmt ist eine Demonstration der Bell-Laboratorien, die 1933 statt- 
fand (Stewart 1980: 51f.; Kellogg 1955: 212 f.). In Philadelphia waren drei 
Mikrofone - rechts, Mitte, links — auf einer Bühne installiert. Drei Telefon- 
leitungen übertrugen die Signale getrennt nach Washington D.C., wo die 
drei Lautsprecher in entsprechender Position aufgestellt waren. Inhalt die- 
ser Demonstration waren ein Orchesterkonzert und eine sich bewegende 
Schallquelle — eine Person, die über die Bühne ging. In dieser Wahl drückt 
sich eine sehr bewusste Einschätzung des ästhetischen Nutzens aus: eine 
Verfeinerung des Klangbilds durch die Abbildung differenzierter Positio- 
nen im Raum und räumliche Dynamik der Bewegung. Zweck der neuen 
Erfindung sollte die Erweiterung der auditiven Perspektive im Rundfunk 
sein. Ähnliche Vorführungen mit aufgezeichnetem Schall folgten. Die 
Anordnung der Elemente blieb dieselbe: drei Mikrofone / Lautsprecher in 
einer Linie. 

Jullier (1995: 114) verweist auf eine nachvertonte Mehrkanalversion 
von NAroL£on (Frankreich 1923, Abel Gance), die 1934 in Frankreich ent- 
stand, ohne jedoch im Kino gezeigt zu werden. 


Fantasound 


Die erste gut dokumentierte Stereoanwendung im Kino war FANTASIA 
(USA 1940, Walt Disney) - ein Versuch, Massenkultur und elitäre Kultur 
zu verbinden. Die Musik zu Disneys Animationsfilm stammte von Bach, 
Tschaikowsky, Strawinsky, Beethoven, Mussorgsky und Schubert. 

Wie Kellogg (1955: 213) berichtet, hatte die akustische Forschung 
dazu schon 1937 begonnen: «Garity und Hawkins hatten Versuche durch- 
geführt, die besagten, dass die Ausgangsleistung zweier Lautsprecher 
konstant gehalten werden muss, wenn sich eine Schallquelle unauffäl- 
lig von einem Lautsprecher zum andern bewegen soll.»'° Die Forscher 
beobachteten, dass diese Voraussetzung nicht durch die entsprechende 
Mikrofonpositionierung gegeben war, sondern durch die Veränderung 
der Intensitätsverteilung manipuliert werden musste. Das endgültige Lay- 
out bestand aus vier Spuren, die auf vier parallel laufende Filmtonträger 


MS-Stereofonie, einer verbreiteten Anordnung, errechnet eine Matrix die beiden Stereo- 
informationen aus einem Mitten- (M) und einem Seitensignal (S). 

16 «Garity and Hawkins reported from tests that if a sound source (from loudspeakers) 
was to seem to move smoothly from one position to another, the output power from the 
two speakers should be held constant.» 


46 Entwicklungslinien der Tontechnik 


kopiert wurden, drei Tonspuren und eine Steuerspur mit Tonimpulsen, 
welche die Verstärkung der verschiedenen Spuren definierte. Drei Laut- 
sprecher befanden sich hinter der Leinwand, je einer an den Seitenwän- 
den. Zusätzlich konnte der Effektkanal durch Randspurmarkierungen 
einem Lautsprecher an der Rückseite des Kinosaals zugespielt werden. 
Das System erforderte eine so komplexe Installation, dass nur zehn Kinos 
damit ausgerüstet wurden. 


Interessanterweise orientiert sich die Raumausrichtung der Musik in FAn- 
TASIA nicht an den Positionen der Instrumente im Orchester, wie sonst bei 
Tonaufnahmen üblich, sondern tendiert dazu, den Bewegungen der Figuren 
auf der Leinwand zu folgen.” (Brown 1994: 60) 


Die Koordination von abstraktem Klang mit Bewegung ist seit der Car- 
toon-Serie SILLY SYMPHONY (USA 1929, Walt Disney) im Universum von 
Disneys Animationen etabliert und wird deshalb Mickey-Mousing genannt. 
Mickey-Mousing stellt den Kausalitätsbezug zwischen optischer und 
akustischer Repräsentation hauptsächlich über die zeitgleiche, synchrone 
Montage her. Bewegungen im geometrischen Raum entsprechen den 
Bewegungen im Klangraum; das Fallen eines Körpers dem fallenden 
Glissando; Treppen steigende Figuren werden durch aufsteigende Ton- 
folge, horizontale Bewegungen durch Imitation des Dopplereffekts mit 
der Kombination von aufsteigendem und fallendem Glissando dargestellt. 
Das Mickey-Mousing hat seine Wurzeln darin, dass im Animationsfilm 
die Zeichnungen auf der rhythmischen Basis einer bereits existierenden 
Musik entworfen werden. 

Fantasound ist die ungehemmte Feier des reinen Sinnesspektakels, 
und es ist daher nicht erstaunlich, dass dieses frühe Experiment besonders 
in den 1970er-Jahren ein Revival erlebt hat, zu einer Zeit, als die Reizdi- 
mension im Kino und in der populären Musikproduktion vermehrt in den 
Vordergrund trat. Wie während der Periode 1928 bis 1933 zeigt sich auch 
an diesem frühen Experiment eine spezifische Offenheit. Spätere Stan- 
dards sind also keineswegs so zwingend und natürlich wie sie in einer 
postadaptiven Phase erscheinen, mit anderen Worten: Die Entwicklung 
hätte auch ganz anders verlaufen können. 


17 «Interestingly, the directionality recorded into FANTASIA's music track, unlike that 
of audio recordings, does not try to mimetically re-create the positions of the instru- 
ments in the orchestra but rather tends to follow the movements of various on-screen 
figures.» 
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Mehrkanal-Magnetton, 1950er-Jahre 


Anfang der 1950er-Jahre erlitt die Filmindustrie in den USA eine deutli- 
che Schwächung durch die zunehmende Konkurrenz des Fernsehens. Die 
ökonomische Krise zwang die Industrie, nach neuen Formen zu suchen, 
um das Produkt Kinofilm für die Zuschauer wieder aufzuwerten. Holly- 
wood griff auf das Breitwandformat zurück, das bereits in der Stummfilm- 
zeit entwickelt worden war. Außerdem sollte die Stereotonspur das Kino- 
erlebnis vertiefen. 

Die eindrückliche technische Perfektion dieser Ära im akustischen 
Bereich geht hauptsächlich auf zwei Faktorenzurück: die Verwendung von 
Magnetton und die exakte Trennung der Kanäle. 

Dass die technisch perfekten Mehrkanalformate nicht überlebten, 
hatte ökonomische Gründe. Ein wesentlicher Faktor war der Verlust 
der Kontrolle über die Kinos als Folge des Anti-Trust-Entscheids, der 
erwähnte Paramount Case (> 14), der die großen Studios zwang, sich von 
ihren Kinos zu trennen. Viele unabhängige Kinobetreiber weigerten sich, 
die Toninstallation den neuen Formaten anzupassen, nachdem die Studios 
den Gerichtsentscheid Anfang der 1950er-Jahre umgesetzt hatten. 


Variationen der Breitwandformate 


Ab 1953 entstand eine Vielzahl von Mehrkanalsystemen. Bei der folgen- 
den Darstellung stehen die Fragen im Vordergrund, welche Grundformen 
der akustischen Aufteilung des Kinoraums in dieser Zeit entstanden sind 
und in welchen Punkten sie sich von den heute gebräuchlichen Forma- 
ten unterscheiden. Detaillierte Auflistungen der verschiedenen Formate 
finden sich in Koshofer 1993b sowie in Carr 1988, dort erweitert um eine 
komplette Filmografie der Breitwandproduktionen; eine komplette Chro- 
nik in Koshofer 1993c. 


CinemaScope 


CinemaScope gehört zur Klasse der magneto-optischen 4-Kanal-Systeme. 
Dabei werden vier magnetische Randspuren als dünne Streifen auf das 
endgültige Filmpositiv überspielt, kombiniert mit einer Lichttonspur für 
die Monowiedergabe in Kinos ohne Stereoanlage. Drei Lautsprecher mit 
der Verteilung links, Mitte, rechts sind hinter der Leinwand positioniert, 
die vierte Spur speist den sogenannten Effektkanal hinten im Kinoraum. 
Der Effektkanal wird bei Bedarf von einem Steuersignal aktiviert und ist 
für Geräusche reserviert. 
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Drei Mikrofone werden in einer Linie am Set in einem Abstand von 
2 bis 2,50 m positioniert. Dieses Layout entspricht also ziemlich exakt der 
Anordnung der Bell-Laboratorien von 1933. Es beruht auf einer Eins-zu- 
eins-Beziehung zwischen Mikrofon- und Lautsprecherposition mit ech- 
ter stereofonischer Repräsentation inklusive Phasen- und Laufzeitunter- 
schiede. Die Kanäle sind in der Endfassung technisch voneinander getrennt. 
Man spricht in diesem Fall von diskretem Stereo im ComMag-Format. 

Dass dieses System von einer realistischen Beziehung der akustischen 
zur visuellen Repräsentation dennoch deutlich entfernt war, beschreibt 
Becker sehr schön: 


PRINCE VALIANT [USA 1954, Henry Hathaway] demonstriert, wie schwierig 
sich eine die volle Bildbreite durchquerende Tonquelle reproduzieren lässt: 
Pferde reiten durchs Bild, mit einem Ruck stoßen sie von einem in den ande- 
ren Bildtonbereich vor. 

Der gleichmäßige Bewegungsablauf vor Augen scheint in der Mitte zwischen 
den Lautsprechern überzuspringen und im Sprung wie stumm zu sein. In 
den Duellen dagegen kommt der Stereoton zu sich; im Schuss-Gegenschuss- 
Wechsel, während die Gegner aufeinander zureiten, wird mit Ausnahme des 
letzten, des einen Bildes, das die Kontrahenten in der Entscheidung in ein 
und demselben Bild zeigt, eine klare Trennung der Lautsprecherkanäle auf- 
rechterhalten. Der Klang des Aufeinanderprallens schließlich liegt zentral im 
Vordergrund. (Becker 1993: 100.) 


Das Problem kommt dadurch zustande, dass die für die Filmproduktion 
üblichen Richtmikrofone eine Schallquelle nur in einem je nach Charakte- 
ristik mehr oder weniger begrenzten Bereich in der Verlängerung seiner 
Achse einigermaßen getreu abbilden. Kontinuierliche Bewegungen lassen 
sich deshalb überzeugender durch die virtuelle Verschiebung einer mathe- 
matisch errechneten Phantomschallquelle oder mittels der etablierten Ste- 
reomikrofonanordnungen (— 44) darstellen. 

Sein vollständiges Potenzial entfaltet CinemaScope bei der Darstel- 
lung großer Klangkörper mit großer Dynamik: Menschenmassen, Kriegs- 
getümmel und Orchester. Favorisiert wurden als korrekte Reaktion ent- 
sprechend epische Monumentalfilme wie THE TEN COMMANDMENTS 
(USA 1956, Cecil B. DeMille), und BEn-Hur (USA 1959, William Wyler), 
Western wie THE ALAMO (USA 1960, John Wayne) und How THE WEST 
Was Won (USA 1963, Henry Hathaway, George Marshall und John Ford) 
sowie Musicals: erfolgreiche Broadway-Shows des Autoren-Komponis- 
ten-Duos Rodgers und Hammerstein wie THE KING AND I (USA 1956, 
Walter Lang). 
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Das Problem der geometrischen Aufteilung des diegetischen Raums 
stellt sich in diesem Verfahren besonders deutlich: Was sich in der einen 
Einstellung links befindet, springt nach dem Umschnitt plötzlich nach 
rechts. Logisch ist dieses Problem nicht zu lösen, sondern nur durch eine 
synthetische Simulation, indem die Positionen in den Übergängen leicht 
zur Mitte hin gefälscht werden. 

Das Publikum dürfte zu Beginn über solche Schwachpunkte, die für 
Umstellungsphasen typisch sind, hinweggesehen haben, mehr noch: Im 
Bruch mit den Konventionen manifestiert sich eine Diskontinuität, die 
zunächst virtuos erscheint, weil das überraschende Moment des Neuen 
und Andersartigen als solches begeistert. Das überwältigende Gefühl von 
Dynamik und Beschleunigung, das diese Produktionen evozieren, geht 
wahrscheinlich maßgeblich auf die extremen Positionierungen rechts und 
links am Bildrand zurück, die nachfolgende Generationen verächtlich als 
Pingpong-Ästhetik bezeichnen. 

Die spezifische Problematik des Effektkanals, die in denselben The- 
menkreis gehört, wird im Abschnitt Surround (> 56) diskutiert. 


Todd-AO, Cinerama und Panavision 


Unter Todd-AO werden in der Regel sämtliche 6-Kanal-Magnettonsys- 
teme mit echtem Stereoton subsumiert. Es ist ein diskretes ComMag-Sys- 
tem. Diskret bedeutet vollständige Trennung der Spuren, die sich auf dem 
70-mm-Bildpositiv (2,2:1) befinden. Michael Todd hat es 1956 in Zusam- 
menarbeit mit Dr. Brian O’Brien von der American Optical Company ausge- 
arbeitet. Cinerama und Panavision benutzen dasselbe Tonformat. 

Die sechs Kanäle verteilen sich folgendermaßen im Kinoraum: links, 
halblinks, Mitte, halbrechts, rechts; der sechste Kanal wird den Surround- 
Lautsprechern im hinteren Teil des Kinos zugespielt. 

Das System hat gegenüber den 4-Kanal-Formaten den Vorteil, dass 
die verschiedenen Positionen horizontal auf der Leinwand besser abge- 
deckt werden, das heißt, es kommt bei den Bewegungen nicht mehr zu 
den von Becker beschriebenen Löchern (> 48). 


Perspecta Stereophonic Sound 


Im Gegensatz zu den 4-Kanal- und 6-Kanal-Systemen ist Perspecta Stereo- 
phonic Sound ein pseudostereofonisches Verfahren, das je einen Kanal 
unterschiedlich positionierten Lautsprechern zuordnet. Es wurde 1954 
von Metro-Goldwyn-Mayer entwickelt und später von Paramount für 
seine VistaVision-Produktionen übernommen. 
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Drei tieffrequente Signale von 30 Hz (rechts), 35 Hz (Mitte) und 40 Hz 
(links) wurden auf den Monolichtton aufkopiert und steuerten die Zuord- 
nung des Monosignals zu drei Lautsprechern hinter der Leinwand. Wie 
Kellogg (1955: 214) schreibt, konnten die Steuersignale die Verstärkung des 
Nutzsignals variabel verändern und erweiterten so den Dynamikumfang. 


Der einzige Nachteil des Verfahrens [...] war, dass man die drei Kanäle 
nicht gleichzeitig getrennt wiedergeben konnte. Musik oder die Geräusche 
von Menschenmengen usw. wurden allen drei Lautsprechern gleichzeitig 
zugespielt. [...] Obwohl dies ein grober Fehler zu sein scheint, muss man 
erwähnen, dass laut zeitgenössischen Berichten nur wenige Zuschauer den 
Unterschied zwischen Perspecta-3-Kanal-Stereo und magneto-optischem 
4-Kanal-Stereo erkennen konnten. '? (Carr 1988: 244) 


Die Überlegungen, welche die Entwicklung von Perspecta begünstigt 
haben, waren ökonomischer Natur. Sowohl bei der Produktion als auch im 
Kino entstanden nur minimale zusätzliche Kosten, und trotzdem konnte 
das System vom Nimbus des Stereo profitieren. Ein deutlicher Vorteil lag 
zudem in der Robustheit der Kopien. 

Wenn irgendwo der Begriff Pingpong-Ästhetik angebracht ist, dann 
wahrscheinlich bei diesem System, das außerdem nicht über die klangli- 
che Transparenz des Magnettons verfügte. 


Dolby 


Es ist einer cleveren Marketingstrategie und den speziellen Bedingungen 
in den 1970er-Jahren zu verdanken, dass der Name Dolby zum Synonym 
für ein spektakuläres Kinoerlebnis avancieren konnte. Die Entwicklung 
ist in diesem Fall deshalb so deutlich, weil Dolby und namhafte Teile der 
Filmindustrie von Anfang an zusammengearbeitet haben. Im Prozess der 
Innovationsdiffusion hat jeder vom Nimbus des Partners profitiert. Die 
Kosten für die Umrüstung auf das neue System wurden zu großen Teilen 
auf die einzelnen Filme gewälzt, die eine Dolby-Lizenz erwerben mussten, 
während sie für die Kinos relativ gering waren. Diese Strategie begründete 
einerseits ein elitäres Image, von dem nur die größten Filmproduktionen 


18 «The only drawback to the process [...] was its inability to render all three channels 
separately, simultaneously. [...] Music, crowd noises, etc., were directed to all three 
speakers [...]. While this might seem a big fault, it should be noted that all contem- 
porary reports indicate that few in the audience were able to ascertain the difference 
in Perspecta three-channel stereo optical and MagOptical four-track stereophonic 
sound.» 
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profitieren konnten, und verbesserte andererseits die Akzeptanz bei den 
Kinobesitzern. 

Im Gegensatz zu weiten Teilendes Publikums reagierten einige Film- 
theoretiker (Doane 1980a und 1980b, Belton 1985) skeptisch bis negativ auf 
die Dolby-Asthetik. Weil die Dolby-Frage vor allem Anfang und Mitte der 
1980er-Jahre Gegenstand der Diskussion war, prägten ideologiekritische 
Positionen die Debatte, wie sie in dieser Periode weit verbreitet waren. 

Eine der schärfsten Kritikerinnen der neueren technologischen Ent- 
wicklungen auf dem Tonsektor ist Doane: 


Technische Fortschritte bei der Tonaufnahme (wie das Dolby-System) zielen 
darauf ab, das Rauschen des Systems zu vermindern, um die Arbeit des 
Apparats zu verbergen und so die Distanz zwischen dem Objekt und seiner 
Repräsentation zu verkleinern.” (Doane 1980a: 164) 


Die Befürchtung, dass die Tonspur den Apparat beziehungsweise den 
Produktionsprozess noch stärker maskiert, impliziert den Vorwurf der 
bewussten Täuschung. Manipulationen, die so perfekt sind, dass sie sogar 
den Kritiker irreführen, entmündigen gemäß der Auffassung Doanes 
(1980a) den Zuschauer. 

Nun kann diese Befürchtung gerade für die Frühphase des Dolby- 
Systems nicht gelten. Selten wurde so unverhüllt mit Effekten geklotzt 
wie in diesen Filmen, die geradezu um diese Effekte gruppiert schienen. 
Ein wichtiger Zweck von Prototypen wie STAR Wars (USA 1977, George 
Lucas), CLOSE ENCOUNTERS OF THE THIRD KIND (USA 1977, Steven Spiel- 
berg) oder ALIEN (USA 1979, Ridley Scott) schien die Feier des technischen 
Fortschritts zu sein. Eine solche Entwicklung lässt sich ohne Zweifel kri- 
tisieren. Dennoch kann man kaum behaupten, dass sich hier der Appa- 
rat verleugne. Viel eher können wir eine Fetischisierung des technischen 
Fortschritts beobachten. Die sensationelle Darstellung von Bewegung, 
Geschwindigkeit und Masse, welche während der Dolby-Frühphase in die 
Tonspuren einzog, stellte eine sinnlich wahrnehmbare Verbindung zwi- 
schen der Technologie und ihren Inhalten her. 

Ein genauer Blick auf die geschichtliche Entwicklung revidiert 
den Innovationscharakter, den Publikum und Kritik dem Dolby-Label 
zuschreiben. Tatsächlich ist das System an sich weder eine Neuentwick- 
lung der Erschließung des Kinoraums noch eine qualitative Verbesserung 
der bereits bestehenden Stereoformate. Alle 4- bis 6-Kanal-Stereoformate 


19 Technical advances in sound recording (such as the Dolby system) are aimed at dimin- 
ishing the noise of the system, concealing the work of the apparatus, and thus reducing 
the distance between the object and its representation. 
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schlossen Surround-Beschallung im hinteren Teil des Kinos ein, teilweise 
unter dem Begriff Effektkanal (> 47). Die technischen Grunddaten, die der 
spektakulären Aufbereitung der Tonspur zugrunde liegen, waren bereits 
in den verschiedenen Magnetton-Verfahren vorhanden. Mehr noch: Die 
wuchtigen Impressionen intergalaktischer Raumerfahrungen waren auf 
den 70-mm-Kopien dieser Filme mit Magnetrandspur viel ausgeprägter 
als in den Dolby-4-Kanal-Versionen, die aus heutiger Sicht schon wieder 
bescheiden wirken. Wie Michael DiCosimo, Manager, und Robert War- 
ren, Ingenieur, (in LoBrutto 1994: 131) bestätigen, hat Dolby erst 1987 mit 
der Weiterentwicklung Dolby SR (Spectral Recording) die Qualitäten des 
Magnetformats erreicht. 

Der Dolby-Mythos hat seine Grundlage darin, dass Mitte der 1970er- 
Jahre nach eineinhalb Jahrzehnten der faktischen Absenz die Erinnerung 
an das Stereoerlebnis im Kino aus dem sozialen Gedächtnis verschwun- 
den war. Die jüngere Generation, die nun das Kinopublikum bildete, hatte 
Stereo nie im Kino erlebt. 

Auch der Eindruck der schieren Quantität, welche die Tonspuren der 
Neuzeit zu dominieren scheint, täuscht. Vergleicht man die Anzahl wahr- 
nehmbarer Geräusche der analysierten Filme (> Korpus 461), so erhält 
man allenfalls einen ungefähren Eindruck. Zur exakten Quantitätsanalyse 
wären Produktionsdokumente - insbesondere Mischpläne - nötig, die 
leider allzu häufig nicht sorgfältig archiviert werden und in Kellern von 
Produktionsfirmen vor sich hindämmern.” Die wahrnehmbaren Geräu- 
sche sind mit der sichtbaren Spitze des Eisbergs vergleichbar, geben also 
allenfalls einen groben Anhaltswert über die tatsächlichen Dimensionen. 
Sie haben insofern eine heuristische Funktion, als es sich lohnt, über die 
möglichen Hintergründe von Anhäufung und Vereinzelung nachzuden- 
ken. Das Quantitätsdiagramm (> Anhang Diagramme 452) muss deshalb 
mit Vorsicht interpretiert werden. 

Gehen wir von einem Schwellenwert von rund 300 wahrnehmba- 
ren Geräuschen aus, so erreichen mehrheitlich Mehrkanal-Stereoproduk- 
tionen ab Mitte der 1950er-Jahre diesen Wert. Monoproduktionen über- 
schreiten diesen Schwellenwert nur ausnahmsweise: im Korpus die relativ 
unbekannte, aber um so bemerkenswertere Produktion TWELVE O’CLock 
Hicu (USA 1949, Henry King), In THE HEAT OF THE NIGHT (USA 1966, Nor- 
man Jewison) und THE Exorcist (USA 1973, William Friedkin), der erst 


20 Es ist mir bei meinen Recherchen nicht gelungen, auch nur einen einzigen Mischplan 
zu finden, weil sich auch bei größeren Produktionsfirmen niemand die Mühe macht, 
diese Unterlagen so aufzubewahren, dass sie später für die wissenschaftliche Analyse 
zugänglich sind. Auch von der Academy of Motion Picture Arts and Sciences werden sol- 
che Dokumente bedauerlicherweise nicht archiviert 
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später in einem Remix in Stereo überführt wurde. Die Produktionen, die 
vom Ende der 1970er-Jahre datieren, heben sich quantitativ nicht sprung- 
haft von den Vorläufern der beiden früheren Jahrzehnte ab. 

Die Vermutung drängt sich auf, dass das Stereoformat an sich kom- 
plexere Kompositionen begünstigt. Mit diesem Aspekt beschäftigt sich 
auch Chion (1990: 125 ff.), und er hat zumindest bedingt Recht, wenn er die 
Rückkehr des Geräuschs in die Tonspur der Erfindung von Dolby-Stereo 
zuschreibt. Bedingt deshalb, weil es eben nicht das spezifische Dolby-For- 
mat, sondern ganz allgemein die Stereotechnik ist, also auch alle magneti- 
schen Vorgängerformate. Die Leere des Stereotons wirkt als Vakuum, das 
einen Sog erzeugt. Im Monoformat müssen die Klangobjekte entlang einer 
einzigen Achse angeordnet werden, gestuft nur durch unterschiedliche 
Lautstärke und allenfalls noch entfernungsmarkierende Raumindikato- 
ren. Das Stereoformat hingegen eröffnet einen neuen Horizont von 30° bis 
360°, in dem die Klangobjekte angeordnet werden können. Stereoaufnah- 
men präsentieren ein transparentes Klangbild, in dem die Hörer ihre Auf- 
merksamkeit gezielt fokussieren können, denn die räumliche Position der 
Schallquelle ist eine der wichtigsten Grundlagen zur auditiven Entflech- 
tung komplexer Klanggemische (> Wahrnehmung komplexer akustischer 
Muster 244). Sie fächern die Tonfläche von Leinwand und Surround in eine 
Vielzahl von Segmenten auf, insbesondere in jenen Formaten, die über 
Split-Surround (> 54f.) verfügen. Alle diese Segmente können einzeln mit 
Klangobjekten bestückt werden, die einander nicht maskieren, weil das 
auditive System die Trennung unterstützt. 

Die besondere Innovation des Dolby-Formats liegt in der Optimie- 
rung des Lichttons, der sich wegen seiner Widerstandsfähigkeit in der täg- 
lichen Handhabung durchgesetzt hat. Zudem haben die von Dolby gefor- 
derten akustischen Installationen inklusive Prozessor die Abspielqualität 
in den Kinos flächendeckend optimiert, weil die Kinos, die das Dolby-Sys- 
tem installierten, speziell eingemessen wurden. 

Dolby-Stereo gehört zur Klasse der matrizierten 4-Kanal-Lichtton- 
systeme, die auch unter dem Begriff S. V. A. (Stereo Variable Area) zusam- 
mengefasst werden. Der Informationsträger ist eine Lichttonspur, deren 
klangliche Charakteristik durch das Dolby-Rauschunterdrückungssys- 
tem hörbar verbessert wurde. Matriziert bedeutet, dass vier Kanäle durch 
eine mathematische Operation auf zwei Spuren encodiert und bei der 
Wiedergabe durch eine inverse Operation wieder dekodiert werden. Im 
Gegensatz zu den diskreten Stereoformaten, die durch eine Trennung der 
Spuren auf dem Träger charakterisiert sind, kann die Verrechnung in der 
Matrix unerwünschte Verschiebungen der Lokalisierung des Klangobjekts 
im Kinoraum erzeugen. Nach den ersten Jahren haben die Erfahrungen 
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R = Rechts 


M = Mitte 
L = Links 
S = Surround 


5 4-Kanal-Stereo 


mit dieser Blackbox zu einer Aufgabenteilung zwischen den Elementen 
geführt. Sprache wird mehrheitlich mono in die Mitte gemischt, während 
man bei der Mischung größere Klangkörper - hier speziell Musik und 
Atmosphären, die im Gegensatz zu den Dialogen bereits in Stereo vorlie- 
gen - auf alle verfügbaren Spuren verteilt. Einzelne Geräusche und Bewe- 
gungen positioniert man heute vorwiegend im vorderen Drittel horizontal 
(zur spezifischen Diskussion des Surround-Kanals Surround 56). 

Die Aufstellung der Lautsprecher respektive Verteilung der Kanäle 
im Kino sind im konventionellen Dolby-4-Kanal-Lichtton-und im 4-Kanal- 
Magnetton-System identisch (Abb. 5). 

Der raumgeometrischen Platzierung von Klangobjekten sind in die- 
ser Aufstellung relativ enge Grenzen gesetzt, weil die Surround-Informa- 
tion diffus abgestrahlt wird. Insbesondere sind keine 360°-Bewegungen 
möglich, die das Publikum umkreisen. 


R = Rechts 

M = Mitte 

L = Links 

Sr = Surround rechts 
S ° 


Sub = Subwoofer 


Surround links 


6 5-Kanal-Stereo mit Split-Surround 
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Davon zu unterscheiden sind die Split-Sourround-Systeme, in denen 
das Surround-Signal zusätzlich nach rechts und links aufgeteilt wird. 
Dazu gehören die 6-Kanal-Formate und das Format 5.1-Kanal (fünf Kanäle 
plus ein Subwoofer für die Bässe), das auch für die DVD (Digital Versatile 
Disc) gebräuchlich ist (Abb. 6). 


Digitale Formate 


Erste einzelne Versuche mit digitalen Speichermedien in den Kinos fanden 
in der zweiten Hälfte der 1980er-Jahre statt. Eine weltweite Umstellung 
setzte Anfang der 1990er-Jahre ein. Die Auswirkungen der Digitaltechno- 
logie auf die Wiedergabequalität sind zwar nicht einschneidend, doch Ver- 
besserungen und eine Erweiterung des Dynamikumfangs bieten die Mög- 
lichkeit, praktisch verlustfrei zu kopieren. Die geschichtliche Komponente 
der Digitaltechnologie und die daraus resultierenden ästhetischen Konse- 
quenzen werden im Kapitel Vom Sampler zur digitalen Workstation themati- 
siert ( 63). Die folgende Zusammenstellung beschränkt sich auf die heute 
gebräuchlichen Formate und ihre technische Aufbereitung. 

Digital Theater Sound (DTS) wurde 1993 mit JurAssıc PARK (USA 1993, 
Steven Spielberg) lanciert. Interessanterweise knüpft es an das Nadelton- 
verfahren an, indem es für Bild und Ton verschiedene Medien kombiniert. 
Die Toninformation befindet sich auf einer CD-ROM, die von Synchronim- 
pulsen auf dem Bildträger gesteuert wird. Eine zusätzliche analog matri- 
zierte Lichttonstereospur hat zwei Funktionen: Sicherung bei Aussetzen 
des Systems und Abspielmöglichkeit in Kinos ohne digitale Installation. 
Auf der CD-ROM befinden sich sechs diskrete Kanäle mit der Aufteilung 
rechts, Mitte, links, Surround rechts, Surround links und ein Basstöner, 
auch Subwoofer genannt. Es gehört damit zur Klasse der 5.1-Kanal-Sys- 
teme (> 64, Abb. 5). 

Dolby SR-D, auch Dolby Digital genannt, gehört ebenfalls zu den 
5.1-Kanal-Systemen. Die digitale Tonspur wird zwischen die Filmperfora- 
tion in komprimierter Form aufgespielt. Daneben befindet sich zusätzlich 
eine analoge Dolby-SR-Lichttonspur. 

Zuletzt hat Sony 1994 unter dem Namen Sony Dynamic Digital Sound 
(SDDS) ein System auf den Markt gebracht, das über acht diskrete Kanäle 
verfügt: links, halblinks, Mitte, halbrechts, rechts, Surround rechts, Sur- 
round links plus Subwoofer. Die digitale Information befindet sich an den 
Kopierändern und wird ebenfalls datenkomprimiert. Auch dieses System 
integriert zur Sicherheit eine SR-Lichttonspur. 
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Zur Problematik des Surround-Kanals 


Die völlige Entgrenzung der Leinwand durch das Surround-Verfahren 
entfaltete eine suggestive Wirkung, die an Fahrten auf der Achterbahn 
erinnerte. Die Orientierung im Raum, die bis dahin durch die Kohärenz 
von Leinwand und Schallquelle transparent war, wurde aufgelöst. Die 
Töne stürzten von allen Seiten gleichzeitig auf den Zuschauer ein. Die 
Erfahrung von akustischer Grenzenlosigkeit stand in scharfer Opposition 
zur Dominanz des Bildes, das traditionell gleichzeitig der Ort der Töne 
war. 

Die Problematik des Surround-Kanals geht auf einen Bruch mit 
der Guckkasten-Tradition des Kinos zurück, in der sich dessen evolu- 
tionäre Verbindung zum Theater niederschlägt. Schon in der Tonbil- 
dära waren die Lautsprecher vorne angeordnet. Damit wurde gleich- 
zeitig die Fiktion untermauert, die Töne stammten von den Objekten, 
die auf der Leinwand sichtbar waren. Es bestand daher eine doppelte 
Notwendigkeit der auditiven Ortung vorne bei der Leinwand, die 
auch bei der Weiterentwicklung des Kinotons berücksichtigt werden 
sollte. 

Die Mehrkanalsysteme der 1950er-Jahre integrierten einen Effekt- 
oder Surround-Kanal, der bei Bedarf von einem Steuerimpuls zugeschal- 
tet wurde. Der abrupte Einsatz des zugeschalteten Effekts führte — wie 
Holman (in LoBrutto 1994: 201) beschreibt?!— zu einer unwillkürlichen 
Kopfbewegung nach hinten und zerbrach das Erzählkontinuum des 
Films. 

Als Stereo in den 1970er-Jahren im neuen Dolby-Format in die Kinos 
zurückkehrte, wurden die Grenzen der neuen Technologie wieder ausge- 
reizt. 


21 «In BEn-Hur gab es eine Szene, in welcher der Protagonist vom Basar zurückkehrt. 

Die Geräusche des Basars wurden im sogenannten Effektkanal wiedergegeben. 
Eine Kuh muhte lautstark hinter mir als Zuschauer. Im McVickers-Kino erschallte 
sie über einen A7-Lautsprecher hinten im Kinosaal. Ich drehte mich um und fragte: 
«Was tut diese losgelassene Kuh bei den Zuschauern im Saal?» Es stört die Kon- 
zentration im Kino, weil man plötzlich nicht mehr das Gefühl hat, einen Film zu 
sehen. 
(«There’s a scene where Ben-Hur is returning from the bazaar and the bazaar is estab- 
lished in, what was called at the time, the «effects channel». A cow mooed loudly behind 
you. Now in the McVickers Theater it played out of an A7 speaker in the back corner of 
the theater. I turned around and said, «What is the cow doing loose in the auditorium 
with the audience? It’s distracting from the movie because suddenly it’s not a movie 
anymore.) 
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Die Sound Designer der Post-STAR-WARS-Ära hatten nicht aus den Fehlern 
der Stereotechniker der 1950er-Jahre gelernt: Regelmäßig nahmen sie genau 
positionierte Handlungsinformationen in den Surround-Kanal auf.” 

(Altman 1995: 70) 


Diese Entwicklung ist modellhaft. Am Anfang steht die technische Innova- 
tion im Vordergrund. Sie sprengt die Grenzen der Konvention, unterwirft 
sich jedoch das filmische Werk und führt in anderen Bereichen zu einer 
ästhetischen Blockade, die sich erst wieder lockert, wenn die Innovation 
gemeistert und konventionalisiert ist und wenn die Auswüchse domesti- 
ziert sind. 

Im Unterschied zur diskontinuierlichen Anwendung des Surround- 
Kanals in den 1950ern haben die Sound Designer der ersten Generation 
jedoch die kontinuierliche Anbindung der Surround-Information an die 
Leinwand über die Bewegung favorisiert: die berühmten Jets und Raum- 
schiffe, die über die Zuschauer fliegen oder das Publikum umkreisen. An 
zweiter Stelle rangierten die imposanten Momente, die sich über die Rän- 
der der Leinwand ausbreiteten und eine unaufhaltsame Allgegenwart 
markierten: Krieg, Dschungel, Dunkelheit, Fremdartiges. 

Dieser Gebrauch geht von der zunächst richtigen Annahme aus, dass 
die diegetische Welt des Films nicht am Bildrand aufhört. Weiter berück- 
sichtigt er in logischer Konsequenz eine Raumperspektive, in welcher 
der Kopf des Zuschauers als Bezugspunkt des Bildes - im weiteren Sinn 
der Kamera - positioniert ist. Aus dieser Raumlogik folgt, dass akusti- 
sche Ereignisse, die in der potenziellen Wirklichkeit der Fiktion seitlich 
oder hinten angeordnet sind, auch im Kino seitlich oder hinten erklingen 
sollten. 

Im kuriosen Effekt, dass eine solche geometrische Projektion des 
natürlichen Klangraums in den Kinoraum die brüchige Heterogenität des 
Apparats ausstellt, wird deutlich, dass die Logik der Fiktion ihre eigenen 
Gesetze haben muss. 

Laut Chion (1990: 75) resultiert das Problem der logischen Ordnung 
im Kino aus dem Unterschied zwischen realer und gedachter Ortung. Die 
reale Positionierung einer Quelle außerhalb des Bildfelds erzeuge einen 
Kulisseneffekt, so Chion (1990: 62 und 74f.). Und außerdem: Wenn Töne 
ihren Ort im Kinoraum haben statt auf der Leinwand, wenn die Schritte 
der Figuren beim Notausgang des Kinos einsetzen oder aufhören, lösen 
sie die Kohärenz der Diegese auf; das Bild wirkt dann ausschnitthaft wie 


22 «Having failed to learn a lesson from the mistakes of Fifties stereo technicians, the 
sound designers of the post-STArR Wars era regularly placed spatially faithful narrative 
information in the surround channel.» 
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eine Pappkulisse. Chion hält die traditionelle Übereinstimmung zwischen 
Leinwand und Lautsprecher für eine «Gnade», weil sie solche Überlegun- 
gen von vornherein ausklammert (1990: 62). 

Gerade im Schaffen eines natürlich wirkenden Raumeindrucks treibt 
die neue akustische Kinotechnologie die Künstlichkeit auf die Spitze. Sie 
hat aus der Notwendigkeit, irrationale Regeln zu installieren und das 
Publikum durch die ständige Gewöhnung zu konditionieren, ein äußers- 
tes Maß an Konventionalisierung erreicht. 

Zwischen geometrischer Logik, angeborenen Suchreflexen und tradi- 
tioneller Ausrichtung befindet sich das schmale Terrain, in welchem sich 
der Surround-Sound nach einer Phase des Experimentierens anzusiedeln 
hatte. Diegetische Klangereignisse, deren Quellen im Bild nicht zu sehen 
sind, wurden danach allenfalls nach links oder rechts verschoben, aber 
äußerst selten nach hinten. Entscheidend dürfte letzten Endes die Tatsache 
sein, dass der Ton auf der Ebene des Mediums als verbindendes Element 
wirksam wird, welches die materielle Heterogenität maskiert. Die Auf- 
gabe, ein kohärentes Erlebnis zu schaffen, bestimmt die Grenzen der Expe- 
rimentierfreude im klassischen Erzählkino. 

Die Trennung zwischen der bewussten Wahrnehmung des akusti- 
schen Ereignisses, das von der Leinwand zu kommen scheint, und der 
unterschwelligen Empfindung einer diffusen Klangwolke macht uns als 
Zuschauer besonders empfänglich für die subkutane Botschaft der Ton- 
spur, die sich im klanglichen Register entfaltet. Dieses Register ist eine 
Welt des Imaginären, der individuellen Fantasie des Zuschauers, die in 
einem mehrdeutigen Reizangebot ihren ureigenen Anker auswirft. Die 
Unmittelbarkeit der persönlichen Reaktion steht in deutlichem Kontrast 
zur intersubjektiven Verbindlichkeit des Begriffs. 

Plüschbestuhlung, Teppichböden, Vorhänge und das Vermeiden 
von parallelen Flächen merzen die raumdefinierenden Eigenschaften des 
Kinosaals mehrheitlich aus. Diffuse Surround-Lautsprecher breiten die 
Töne gießkannenartig in gleichschaltender Weise über das gesamte Publi- 
kum aus. Sie umfassen es als sozialen Körper und tauchen es in ein emo- 
tional wirksames Klangbad. Das Kinoerlebnis beruht unter anderem auf 
diesem auditiven Raumgefühl, welches Adorno/Eisler als archaisches 
Element bezeichnen. 


Hören ist, verglichen mit dem Sehen, archaisch, mit der Technik nicht mit- 
gekommen. [...] Darum wohnt der akustischen Wahrnehmung als solcher 
unvergleichlich mehr als der optischen ein Moment von altertümlicher Kol- 
lektivität inne. 


[...] 
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Dies unmittelbare, am Phänomen haftende Verhältnis zum Kollektiv hängt 

wahrscheinlich mit der Raumtiefe zusammen, dem Gefühl des Umfassen- 

den, den Einzelnen Einbeziehenden, das von aller Musik ausgeht. 
(Adorno/Eisler 1944: 30) 


Das ozeanische Gefühl, das die klangliche Umhüllung auslöst, befördert 
die Regression in jene präsymbolischen Schichten, die sich der Kontrolle 
des Verstandes entziehen. 


Hall als Element der Tonperspektive 


Zwar bestand die Technologie, Hall” künstlich zu erzeugen, sehr früh, wahr- 
scheinlich von Anbeginn der Tonfilmproduktion. Hall findet sich bereits in 
Mamoulians APPLAUSE (USA 1929), in King Vidors HALLELUJAH! (USA 1929) 
sowie ausgeprägt und sehr bewusst in George Hills THE Bric House (USA 
1930). Im Zeitraum von Anfang 1930er- bis Ende 1950er-Jahre wurde er 
jedoch außer in Subjektivierungen (> 362) kaum verwendet. Im Korpus des 
vorliegenden Projekts bildet CrrrzzN KANE (USA 1941, Orson Welles) eine 
einsame Ausnahme. Aus Gründen der beschränkten Auflösung des Mono- 
lichttons galt Hall einerseits als Feind der Sprachverständlichkeit, ande- 
rerseits ließen sich subtilere Raumnuancen in dieser Technologie gar nicht 
abbilden, weil sie dem Rauschen zum Opfer fielen (> Tonperspektive 150). 

Üblich waren bis in die 1970er-Jahre sogenannte Hallräume, riesige 
leere Räume, in welchen Lautsprecher das Tonsignal abstrahlten und 
Mikrofone die Reflexionen wieder einfingen. Verwendet wurden auch 
große Metallplatten oder Metallfedern, welche vom Schall in Schwin- 
gung versetzt wurden. Alle diese Verfahren hatten jedoch den Nachteil, 
sehr aufwendig und unhandlich zu sein. Bescheidene analoge Hallgeräte, 
die den Vorteil hatten, portabel zu sein, waren in der Musikindustrie seit 
den 1960er-Jahren verbreitet. In der Filmproduktion setzte der Hallboom 
jedoch erst Anfang der 1980er-Jahre ein, als die ersten digitalen Hall- und 
Verzögerungsgeräte auf den Markt kamen. Diese sogenannten Raumsimu- 
latoren können sämtliche Raumparameter inklusive typischer Klangver- 
färbungen errechnen, vom dumpfen Hall einer Toilette bis zur ätherischen 
Transparenz einer gotischen Kathedrale. 

Damit erschloss sich dem Film eine neue räumliche Tiefendimension. 
Kombiniert mit der Auffächerung der Klangfläche in der Horizontalen 


23 Grundlagen zum Thema Hall folgen im Abschnitt Physikalische Aspekte der akustischen 
Raumpräsentation (> 300). 


60 Entwicklungslinien der Tontechnik 


wurde eine Vielzahl von Positionen im Raum möglich, welche die einzel- 
nen Klangobjekte voneinander unterscheiden. Die komplexe Architektur 
zeitgenössischer Tonspuren - die ein zentrales Thema dieser Arbeit bildet 
und immer wieder in all ihren Konsequenzen thematisiert wird — wäre 
ohne diese Erweiterung der Raumperspektive nicht denkbar. 


Die Automatisierung der Mischung 


Wie im Abschnitt Klanglichkeit des frühen Tonfilms (> 37) beschrieben, waren 
der Mischung während der Lichttonära relativ enge Grenzen gesetzt, teil- 
weise aus Gründen der Materialqualität, vor allem aber weil ganze Akte, 
das heißt, rund 10-minütige Teile, in einem Durchgang gemischt wer- 
den mussten.”* Die damals entwickelte Arbeitsteilung zwischen je einem 
Mischtonmeister (Re-Recording Mixer) für Sprache, Musik und Geräusche 
ist heute in Hollywood noch üblich. 

Auch in der frühen Magnetzeit war es zunächst nicht möglich, an 
einem beliebigen Ort unhörbar in die Aufnahme einzusteigen. Hingegen 
erlaubte die Qualität des Magnettons Vormischungen, welche einzelne 
Klassen von Elementen, zum Beispiel Schritte, aufeinander abstimmten, 
sodass sich die Komplexität sozusagen in Stufen reduzierte. Erst in den 
späten 1960er-Jahren wurde das sogenannte Rock-’n’-Roll-Verfahren ein- 
geführt, bei welchem die Mischung sich in kleinen Abschnitten vorwärts 
bewegte, die man sofort zur Kontrolle abhörte. Damit konnte man jedes 
Detail ohne Risiko perfektionieren, fehlerhafte Stellen wurden bei der 
erneuten Aufnahme einfach überschrieben. Diese Entwicklung revolutio- 
nierte das Verfahren nicht grundlegend, sondern führte lediglich zu einer 
ökonomisch vertretbaren Vereinfachung bereits etablierter ästhetischer 


24 Dazu Tom Fleischman (in LoBrutto 1994: 175): «Man musste vom Beginn bis zum Ende 

der Rolle alles — Dialog, Musik und Geräusch - in einem Durchgang mischen. Deshalb 
hat man in Los Angeles ein System entwickelt, bei dem einer für den Dialog, einer für 
die Musik und ein Dritter für die Geräusche zuständig war. Diese Teams übten zuerst 
in mehreren Durchgängen ohne Aufnahme so lange, bis jeder von ihnen genau wusste, 
was er zu tun hatte. Dann erst nahmen sie die Mischung auf. Die Leute erzählen, 
dass es wie bei einem Pferderennen zu- und herging. Wenn das Ende der Rolle nahte, 
begann man die Fußnummern zu zählen und innerlich zu frohlocken, denn man wollte 
das Ende erreichen, ohne die Aufnahme zu gefährden.» 
(«You had to begin at the beginning of the reel and do everything - the dialogue, music, 
and sound effects to the end of the reel in one take without stopping. So in LA they cre- 
ated a system where one man did dialogue, one man did music, the third man did sound 
effects. These teams would spend a lot of time rehearsing the reel over and over again, 
not recording anything until each mixer knew exactly what he had to do at any given 
moment. Then they would make a take. People say it was like watching a horse race. As 
you got down to the end ofthereel, you’d be watching the footage counter numbers, and 
you’d start to silently cheer because you wanted to get to the end without blowing it.») 
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Vorstellungen und hatte deshalb keinen zwingenden Einfluss auf die 
quantitative Komplexität der Tonspuren. 

Auch im Rock-’n’-Roll-Verfahren mussten die Mischtonmeister nach wie 
vor jede Veränderung bei jedem Durchgang von Hand ausführen, eine Auf- 
gabe, die musikalische Virtuosität und größtes Fingerspitzengefühl verlangt. 

Es ist Coppolas exzessiver Tonbesessenheit zuzuschreiben, dass er in 
sein Produktionszentrum American Zoetrope in San Francisco ein maßge- 
schneidertes Tonstudio mit einer automatisierten Mischkonsole einbauen 
ließ (Beggs 1997). 

Mit dem automatisierten Mischprozess werden die Hände frei. Eine 
potenziell unendliche Menge von Tönen könnte zusammengemischt wer- 
den, weil jede einzelne Position der Regler und peripheren Einstellungen 
gespeichert wird. Digitales Aufnahmematerial mit einem Maximum an 
Auflösung und dynamischer Kapazität, kombiniert mit einem Minimum 
an Rauschen, treibt diesen infiniten Prozess in neue Dimensionen. Produk- 
tionen wie TERMINATOR 2 (USA 1991, James Cameron) oder JURASSIC PARK 
(USA 1993, Steven Spielberg), die mit einer nie da gewesenen Dichte die 
Sinne überfluten, sind direkte Abkömmlinge dieser Technologie. Im Ver- 
gleich dazu nehmen sich STAR WARS und ArocALYPSE Now schon wieder 
bescheiden aus, was in jüngster Vergangenheit unter anderem zu Remixes 
der STAR Wars-Trilogie oder auch der ersten deutschen Dolby-Produktion 
Das Boor (BRD 1981, Wolfgang Petersen) geführt hat. 


Mehrspurtechnik in der Aufnahme 


Ebenso wie Coppolas unkonventionelle Tonideen erforderte Robert Alt- 
mans filmische Darstellung von dynamischen Gruppenprozessen ein 
unkonventionelles Aufnahmeverfahren - als prominenteste Beispiele gel- 
ten NASHVILLE (USA 1975) und A WEppING (USA 1978) -, das er erstmals 


25 Beggs schilderte Coppolas Motivation, unübliche Technologien zu verwenden im 

Interview folgendermaßen: «Er wollte eine Tonspur von neuen Dimensionen. Wir setz- 
ten erstmals die automatisierte Mischung in einem Mainstreamfilm ein. Es gab in Hol- 
lywood eine extreme Abwehrhaltung gegen die Automatisierung. Sie benutzten sie 
erst sieben Jahre später als wir. Die hartnäckige Forderung nach Reichhaltigkeit, die 
von Francis und anderen Regisseuren gestellt wurde, führte dazu, dass man techni- 
sches Equipment aus anderen Bereichen einsetzte. Das inspirierte wiederum die Her- 
steller [der Filmtechnologie].» 
(«He wanted a sound track that nobody had ever heard before. We used the first auto- 
mated mix in a mainstream feature film. [There was] a tremendous reluctance in Hol- 
lywood to use automation. They didn’t use automation until several years after we did 
APOCALYPSE Now. Francis’s and other directors’ insistence or demand for this richness 
was bringing in technology that wasn’t traditionally film technology. And that in turn 
inspired manufacturers [...].») 
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in California Split (USA 1971) zur Anwendung kommen ließ. Laut Webb 
(1979: 368) wünschte sich Altman nach seinen frustrierenden Erfahrungen 
mit der konventionellen Tontechnologie bei MCCABE & Mrs. MILLER (USA 
1971) ein flexibleres System, das folgende Gestaltungselemente erlaubte: 
Dialogimprovisation und -überlappungen, die Aufzeichnung von Sprache 
auch außerhalb der Bildgrenzen sowie von jenen Geräuschen und unter- 
geordneten Dialogteilen, die normalerweise ausgeblendet werden, damit 
sie den Hauptdialog nicht stören. 

James E. Webb Jr. entwickelte als Filmtonmeister (Location Sound 
Mixer) ein Tonsystem, das diesen Anforderungen genügte. Er modifizierte 
drei 1-Zoll-8-Spur-Maschinen, wie sie damals für Musikaufnahmen üblich 
waren, indem er auf jeweils einen der acht Kanäle eine Steuerfrequenz von 
60 Hz aufspielte, welche die Synchronisation von Bild und Ton garantierte. 
Mit einer handelsüblichen 12-V-Autobatterie besorgte er die Speisung, um 
nicht auf einen Stromanschluss angewiesen zu sein. Sämtliche Schauspie- 
ler wurden mit drahtlosen Funkmikrofonen bestückt und deren Signale 
auf die einzelnen Spuren aufgenommen. 

Ein umgebauter Flachbettschneidetisch ermöglichte die simultane 
Bearbeitung von neun Spuren, verteilt auf drei 3-Spur-Magnetperfos. Für 
die Endbearbeitung des Tonschnitts wurden die Originalaufnahmen noch- 
mals getrennt auf 1-Spur-Perfo überspielt, um den Dialog von Störungen 
und Einstreuungen befreien zu können. Die Auswahl der im Film hörbaren 
Dialogteile verlagerte Altman auf diese Weise in die Mischung, beider ihm 
noch alle Kombinationsmöglichkeiten offenstanden. 

Das Verfahren scheint perfekt. Idealtypisch erscheint in dieser Ent- 
wicklung auch das Zusammenspiel von ästhetischer Idee und praktischer 
Innovation. Dennoch hat es sich nicht durchgesetzt, weil es mit einer 
Reihe von Begrenzungen befrachtet ist, die für den Altman-Stil typisch 
sind. Außer dessen Filmen sind noch ALL THE PRESIDENT’S MEN (USA 
1975, Alan J. Pakula) und Francis Ford Coppolas ONE FROM THE HEART 
(USA 1982) unter Verwendung der Mehrspurtechnik in der Originalauf- 
nahme entstanden. Als Filmtonmeister wirkte in beiden Produktionen 
James Webb. Der wichtigste Nachteil des Verfahrens ist klanglicher Natur: 
Die Funkmikrofone sind den hochstehenden Kondensatormikrofonen, 
die heute verwendet werden, qualitativ unterlegen; und die Notwendig- 
keit, sie unter der Kleidung oder im Haar der Schauspieler zu verstecken, 
beeinträchtigt den Klang nochmals hörbar. Eine Form der Tonperspektive 
kann in dieser Technik allenfalls rudimentar simuliert werden, weil es der 
Aufnahme an räumlicher Transparenz fehlt. Ganz zu schweigen von der 
extrem aufwendigen Kleinarbeit, die bei der Endmischung anfällt, und von 
der unüberschaubaren Logistik am Drehort. 
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Altman versteht es, diese Mangel virtuos in seinen Stil zu integrieren. 
In geradezu unverfrorener Weise verlagert er die Aufmerksamkeit des 
Betrachters vom Vorder- in den Hintergrund und wieder zurück, indem er 
Dialogpassagen nach Bedarf aus- oder einblendet. Offensichtlich akzeptie- 
ren Zuschauer diese eigentlich rohen Eingriffe in die etablierte Konvention 
des nahtlosen Fließens. Selbst Filmstudenten wundern sich im Allgemei- 
nen erst bei der zweiten Visionierung über die frechen Eingriffe, die sie 
dann allerdings äußerst kritisch beurteilen. 

Die Akzeptanz dieses Stils hängt hauptsächlich mit der verschlunge- 
nen Erzählweise in Altmans Filmen zusammen, in welchen immer meh- 
rere Stränge parallel laufen und die Schauplätze - in THE PLAYER (USA 
1992) unter anderem Restaurants, Konferenzräume, Partys oder Stu- 
diogelände — großräumig von Menschenansammlungen bevölkert wer- 
den. In Hollywood blieb man skeptisch: «Jack Warner hat einmal über 
mich gesagt: «Dieser Dummkopf lässt mehrere Schauspieler gleichzeitig 
reden.>» (Robert Altman in Oumano 1989: 129). 


Vom Sampler zur digitalen Workstation 


Ende der 1970er-Jahre setzte die Entwicklung der digitalen Technologie 
ein. Digitale Tonbearbeitung ist nur ein Fragment innerhalb einer globalen 
Umwandlung sämtlicher Informationsströme in mathematische Codes. 
Zur Digitalisierung des Klangs wird der kontinuierliche Fluss in winzige 
Stücke zerhackt, mit einer Frequenz (Sampling-Frequenz genannt) von 44,1 
oder 48kHz, das heißt, 44.100- oder 48.000-mal pro Sekunde. Diese Stücke, 
Bytes genannt, bestehen aus Kombinationen von 8 bis 20 Bits, welche als 
binäre Codes, bestehend aus 0 und 1, den Zeitverlauf des Schalls reprä- 
sentieren. Die Schallwelle wird nicht mehr als fließendes Signal abgebil- 
det, sondern eigentlich punktförmig, wobei die Verbindungen zwischen 
den Punkten, den einzelnen Stücken, auch Samples genannt, rechnerisch 
interpoliert werden. Je nach Auflösung, die durch die Samplingfrequenz 
und die Bit-Zahl definiert wird, entstehen mehr oder weniger stufenför- 
mige Abbildungen. Als Speichermedien dienen entweder Magnetbänder, 
Magnetbandkassetten (Digital Audio Tape DAT) oder verschiedene plat- 
tenförmige Formate wie die Compact Disc (CD), Computerfestplatten 
oder Magneto-Optical-Discs. 

Das Digitalformat verfügt gegenüber den analogen Formaten über 
den Vorteil, dass die mathematische Struktur des Datenmaterials unab- 
hängig vom Speichermedium ist und daher beliebig oft kopiert werden 
kann. Es entfällt beispielsweise das Bandrauschen. Aus diesem Grund ver- 
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größert sich der Dynamikumfang, also die Differenz zwischen den leisesten 
und lautesten Stellen einer Aufnahme. Fehler entstehen hingegen bei der 
Wandlung des urspriinglich analogen Signals, das die Schallwandler, die 
Mikrofone, nach wie vor liefern. Bei Ubersteuerungen, das heißt, bei zu 
großen Pegeln, bricht das Signal vollständig zusammen. 

Zwischen sehr guten digitalen und sehr guten analogen Aufnahmen 
bestehen kaum hörbare Unterschiede. Deshalb ist es für die Ästhetik der 
Tonspur von geringer Relevanz, ob die Originalaufnahme oder das End- 
produkt, die Tonaufzeichnung auf der Kinokopie, analog oder digital aus- 
geführt wurden. Die revolutionäre Kraft des Digitalformats entfaltet sich 
im Zwischenstadium der Tonpostproduktion. Die mathematische Form, 
welche die punktförmigen Repräsentationen des Schalls beschreibt, lässt 
sich beliebig verändern oder, wenn man so will, manipulieren. Damit sind 
Eingriffe in das Klangmaterial weit jenseits der menschlichen Wahrneh- 
mungsfähigkeit möglich geworden. Jede Charakteristik des Schalls, die 
genauer in den Kapiteln Frequenz (> 192) und Dynamik (> 225) beschrie- 
ben werden, sei dies nun Tonhöhe, spektrale Zusammensetzung oder 
Hüllkurve auch einzelner harmonischer Bestandteile, lässt sich mit dieser 
Technik bearbeiten. Jeder Parameter steht für die Bearbeitung zur Verfü- 
gung. Rekurrieren diese Bearbeitungsmöglichkeiten noch auf vorhande- 
nes Klangmaterial, ist jedoch auch die völlig abstrakte Klangproduktion 
möglich geworden, bei welcher man einen Klang zeichnerisch entwirft. 

Die Diskussion um Original und Fälschung hat auf dem Hintergrund 
dieser neuesten Entwicklung eine andere Dimension erhalten. Zwischen 
dem akustischen Ereignis, seiner technischen Speicherung und Wieder- 
gabe besteht nur noch eine lose Verbindung, mehr noch: Ein Klangobjekt 
auf einer Aufnahme zu hören, heißt nicht mehr, dass dieses Klangobjekt 
in der realen Welt einmal existiert hat. Längst ist es bei Musikaufnahmen 
üblich, das nicht ganz so hohe C einer Sopranistin digital nachzustimmen 
oder den nicht ganz so lupenreinen Klang durch die brillantere Version 
aus einer anderen Aufnahme - auch einer anderen Stimme - zu ersetzen. 
Schleppende Passagen werden etwas beschleunigt, Nuancen der Artiku- 
lation nachträglich hinzugefügt. Theoretisch ist es denkbar, John Lennon 
oder Maria Callas mit vorhandenem Material Kompositionen singen zu 
lassen, die sie nie gesungen haben. In FARINELLI- IL CASTRATO (Belgien / 
Frankreich 1994, Gerard Corbiau) setzte sich die Stimme des Kastraten 
aus zwei Stimmen zusammen, der etwas beschränkte Tonumfang des 
Kontratenors wurde mit einer — notabene weiblichen — Sopranstimme 
erweitert. 

Moralische Entrüstung über solche Fälschungen ist im Fall von 
Musikaufnahmen gerechtfertigt. Ihre Hörer gehen vom dokumentari- 
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schen Charakter dieser Aufnahmen aus. Die Falschungen sind so perfekt, 
dass sie keine Spuren hinterlassen und mit unseren evolutionär entwickel- 
ten Wahrnehmungsorganen nicht mehr zu entdecken sind. Im Lauf der 
Stammesgeschichte der Menschheit spielte es keine lebenswichtige Rolle, 
zwischen Original und Fälschung von akustischen Ereignissen zu unter- 
scheiden. Bis vor rund 100 Jahren waren alle akustischen Phänomene Ori- 
ginale. 

Heute simulieren CDs eine Perfektion, die in der natürlichen Welt 
nicht vorkommt und der kein noch so virtuoser Musiker entsprechen 
kann. Diese Perfektion beeinflusst die Erwartungshaltung des Hörers in 
ungesunder Weise. Es wird heute schon beobachtet, dass das Publikum 
vom Klang im Konzertsaal enttäuscht ist. Mit immer aufwendigeren akus- 
tischen Installationen bis hin zur diskreten elektronischen Unterstützung 
versucht man, diese Erwartungshaltung zu befriedigen.” Anders liegt der 
Fall bei Filmtonspuren. Der grundlegend fiktive Charakter der nachweis- 
lich konstruierten Diegese, des im Film dargestellten Raum-Zeit-Kontinu- 
ums, suggeriert nur mittelbar eine Verbindung zur Wirklichkeit. Stimmen 
werden seit Beginn der Tonfilmzeit ersetzt. Hitchcock ließ schon in BLACK- 
MAIL (GB 1929) die Stimme der deutschen Schauspielerin Anny Ondra von 
einer englischen Schauspielerin live synchronisieren, die am Set in einem 
schalldichten Glaskasten” stand. 

Die lange Tradition mechanischer Verfremdungen (> 277) hat die 
Manipulation der akustischen Phänomene im Kino seit Jahrzehnten eta- 
bliert. Die Theorie hat sich bis heute nur marginal mit diesen Eingriffen 
auseinandergesetzt. Die wesentlichen theoretischen Positionen werde ich 
im Kapitel Abbildung (> 69) auf dem Hintergrund der Beschreibung von 
Technik und Praxis, wie sie die hier geschilderten Überlegungen prägt, 
diskutieren. 

Obwohl die Geschichte der digitalen Klangprozessierung sehr jung 
ist, sind zuverlässige Informationen über ihre Entwicklung schwierig zu 
beschaffen. Einige Daten finden sich in Kongressberichten, zum Beispiel 
in den Berichten der deutschen Tonmeistertagungen. Eine weitere Quelle 
sind Fachperiodika wie American Cinematographer, Journal of the Society of 
Motion Pictures and Television Engineers, Studio Sound oder Mix Magazine. 


26 Der Akustiker Russell Johnson hat deshalb den Konzertsaal im Luzerner Kongress- 
zentrum mit veränderlichen Raumeigenschaften ausgerüstet, die der Art der Musik 
angepasst werden können (Interview mit Dorothea Baumann in der NZZ, Nr. 189, vom 
18.8.1998, Seite B11). 

27 In dieser Hinsicht unterscheidet sich die englische Übersetzung - dort steht lediglich 
«außerhalb des Bildes» (outside the frame) — sowohl von der französischen Version als 
auch von der deutschen Übersetzung. Die Genese des Buchs legt es nahe, die französi- 
sche Version als Original zu verstehen. 
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Zum Beispiel hat das bei den Praktikern viel beachtete Mix Maga- 
zine zu seinem 20-jährigen Bestehen ein Sonderheft (1997) publiziert, das 
sämtliche Entwicklungen dieses Zeitraums in technisch fundierter Weise 
darstellt. Leider haben bis heute nur wenige Hersteller Firmengeschichten 
mit detaillierten Angaben auf ihren Homepages im Internet. Dazu gehö- 
ren 1999 zum Beispiel Dolby und der Schweizer Hersteller der weltweit 
eingesetzten Nagra, die Firma Kudelski, oder Skywalker Sound, der Studio- 
komplex mit integrierter Entwicklungsabteilung, die von George Lucas 
gegründet wurde. 

Das Kernstück der digitalen Klangrevolution heißt heute Digital 
Audio Workstation, allgemein einfach Workstation, seltener deutsch digitaler 
Schnittplatz genannt. Die Grundform einer Workstation kombiniert einen 
Sampler mit verschiedenen Formen der digitalen Synthese. Ein Sampler 
ist nichts anderes als eine digitale Speichereinheit, auf welcher natürliche 
Klänge vom Musikinstrument bis zu jedem beliebigen Umweltgeräusch 
in digitaler Form aufgezeichnet und wieder abgerufen werden können. 
Diese Klänge bilden das Grundmaterial für die Synthese. Sie können über 
die Tastatur eines Keyboards mehrstimmig abgerufen, so genannt getrig- 
gert, beliebig rhythmisiert oder in andere Tonlagen transponiert werden. 
Über eine solche Grundausstattung verfügte der erste Prototyp dieser 
neuen Generation von Tonmaschinen, das Synclavier. Es wurde 1978 von 
der Firma New England Digital auf den Markt gebracht (Mix Magazine 
1997: 62). Ein Jahr später lieferte Fairlight das erste Modell ihrer Serie CMI 
(Computer Musical Instrument). Dieses Modell erlaubte den zeichneri- 
schen Eingriff in die grafische Darstellung von bestehenden Wellenformen 
oder auch das einfache Zeichnen von beliebigen Klangobjekten mit einem 
beleuchteten Stift auf der Monitoroberflache. TRon (USA 1982, Steven Lis- 
berger), ein auch visuell vorwiegend synthetischer Science-Fiction-Film 
von Disney, war eine der frühesten Produktionen, deren Tonspur auf dem 
Fairlight geschaffen wurde. 

Im Übrigen verhielt sich die Filmindustrie gegenüber den neuen 
Technologien Anfang der 1980er-Jahre zögerlich. Die herkömmlichen 
Techniken der Verfremdung und Tonmontage waren so ausdifferenziert, 
dass keine unmittelbare Notwendigkeit zur Integration der digitalen 
Klangprozessierung zu bestehen schien. Selbst die sehr musikalisierte 
Geräuschkomposition in RUMBLE FtsH (USA 1982, Francis Ford Coppola) 
wurde analog mit 24-Spur-Technik von Richard Beggs hergestellt.’ 


28 Unter Verwendung eines ausgeklügelten Systems von Peripheriegeräten wie synthe- 
tischem Hall und einer Nagra mit klassischem Geschwindigkeitsregler hat er einzelne 
Effekte auf eine 24-Spur-Maschine überspielt. Jeden einzelnen Ton hat er dabei mit 
einem genau abgemessenen Papiervorlauf so positioniert, dass die Abspiel- und die 
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1983 wurde mit dem sogenannten MIDI-Format ein internationaler 
Standard geschaffen. MIDI heifst Musical Instrument Digital Interface und 
bezeichnet ein Protokoll zum Datenaustausch zwischen verschiedenen 
Komponenten der digitalen Klangaufbereitung, wie zum Beispiel zwi- 
schen Keyboards, Computern und Samplern (umfangreiche Darstellung 
bei Ruschkowski 1998: 371 f.). Das MIDI-Format befreite den Sampler aus 
dem starren Verbundextrem teurer Workstations, wie dem Synclavier, das 
als Rolls-Royce unter den ersten Modellen mehrere Hunderttausend Dol- 
lar kostete (Karlin 1994: 31). Ab 1984 fanden Sampler größere Verbreitung 
in der Filmindustrie. Ihr wesentlicher Vorzug wurde in der Zeiterspar- 
nis gesehen. Auf einzelne Töne, die auf Floppy-Discs gespeichert waren, 
konnte man direkt zugreifen und so auch während der Mischung nach 
Bedarf fehlende Elemente sofort in die Gesamtkomposition integrieren. 
Bis Ende der 1980er-Jahre existierten konventionelle und digitale Verfah- 
ren nebeneinander. Workstations, die spezifisch auf die Bedürfnisse in 
der Filmpostproduktion zugeschnitten waren, fanden ab 1988 Verwen- 
dung. Lucasfilm hatte bereits 1985 mit dem SoundDroid einen Prototypen 
geschaffen: 


Ausgestattet mit Bildverknüpfung, Mehrspuraufnahme, Klangsynthese, 
Schnitt, Mischung, Lautstärkereglern, Hall und Effekten, die man auf einem 
berührungsempfindlichen Grafiktablett bearbeiten konnte, Steuerungstas- 
ten, frei belegbaren Drehreglern, Schiebereglern und einem Suchlaufring war 
es eine fesselnde technische Errungenschaft.” (Mix Magazine 1997: 72) 


SoundDroid ging zwar nie in Serienproduktion, formulierte aber die 
Ansprüche der Filmindustrie an einen brauchbaren digitalen Tonschnitt- 
platz. 

Heute arbeitet die Mehrheit der Praktiker auf Workstations, die im 
Zuge der weltumspannenden Weiterentwicklung der Computertechno- 
logie über Myriaden von sogenannten Plug-ins verfügen. Plug-ins sind 
Unterprogramme für die Bearbeitung von speziellen Problemen oder die 


Aufnahmemaschine genügend Zeit hatten, zur Normalgeschwindigkeit hochzulaufen. 
Dieses Verfahren ermöglichte ihm eine sehr genaue Kontrolle der verschiedenen Ele- 
mente hinsichtlich ihres klanglichen Kontexts. Im Gegensatz zur Arbeit mit dem klas- 
sischen Flachbettschneidetisch mit nicht mehr als drei synchron laufenden Tonbändern 
konnte er so 24 Spuren gleichzeitig bearbeiten und somit ihre Struktur und innerklang- 
lichen Beziehungen sehr exakt bestimmen (Beggs 1997). 

29 «Offering picture interlock, multitrack recording, sound synthesis, editing, mixing, 
dynamics control, reverb and effects from a slick interface of touch-sensitive graphics 
screen, soft-keys, assignable knobs, moving faders and shuttle wheel, it was a spell- 
binding technological achievement.» 
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Anwendung von allen nur erdenklichen Effekten. Von der Raumsimu- 
lation per Mausklick bis zu manuell entworfenen Filtern fiir spezifische 
Störgeräusche — wie das immer noch hörbare Surren der Kamera — kann 
alles von einem einzigen Interface aus angewendet werden. Marktführer 
ist zurzeit die Firma Digidesign mit dem System ProTools. 

Diese doch beachtliche Innovation des Arbeitsprozesses müsste sich 
eigentlich — so würde man annehmen - auf die Tonästhetik hörbar aus- 
wirken. Jedoch lässt sich im Korpus seit den späten 1980er-Jahren keine 
einschneidende Veränderung, die auf diesen Einfluss zurückgehen würde, 
ausmachen. Allenfalls ist ein Hang zu einer kühlen Perfektion zu beobach- 
ten, weg von der authentisch wirkenden Rostigkeit der frühen New-Holly- 
wood-Produktionen, die den ungehobelten Charme eines dokumentarisch 
wirkenden Stils pflegten. Der zunehmend ausgereizte Dynamikumfang 
mit ohrenbetäubenden Lautstärken geht auf das Konto der digitalen For- 
mate auf der Kinokopie. Möglicherweise sind die dichteren Schichtun- 
gen mit einer größeren Anzahl von wahrnehmbaren Klangobjekten, die 
ab Mitte der 1980er-Jahre auftauchen, zumindest teilweise eine Folge der 
zeitsparenden Vereinfachung der Tonmontage am digitalen Arbeitsplatz. 


2 Abbildung 


Theoretische Positionen 


Die Frage nach dem Abbildungsverhältnis zwischen dem akustischen 
Ereignis und seiner Wiedergabe im Kino wird in der Filmtheorie kontro- 
vers diskutiert. Sie ist von einiger Konsequenz, auch fiir die Praxis. Denn 
die weitverbreitete Ansicht, das ausschlaggebende Qualitätsmerkmal 
einer Tonaufnahme sei die getreuliche Reproduktion eines akustischen 
Ereignisses in der Wirklichkeit, schliefst implizit eine aktive kreative Tatig- 
keit aus. In einer solchen Konzeption tritt vielmehr ein optimierter tech- 
nischer Prozess an die Stelle einer individuellen Schöpferpersönlichkeit. 
Diese Auffassung hat eine lange Tradition. Sie wurde bereits 1930 von 
Baläzs (1930: 161) geäußert: «Der Ton wird nicht dargestellt. [...] Denn auf 
der Leinwand erscheint wohl das Bild des Schauspielers, aber nicht das 
Bild seiner Stimme, sondern die Stimme selbst.»! In Balázs’ Äußerungen 
schwingt eine ambivalente Einstellung zu den Qualitäten des Tons mit; 
zum Teil idealistische Begeisterung für seine Unmittelbarkeit, die — wie er 
meint — den Phantomcharakter des Bildes entlarven werde; zum Teil Ver- 
achtung, weil der Ton nichts weiter als eine primitive Reproduktion sei. 
In den 1970er-Jahren wurde diese Auffassung innerhalb der Appara- 
tus-Theorie neu belebt. Die Apparatus-Theorie befasst sich mit dem Ein- 
fluss der Maschine Kino auf die Wahrnehmung des Zuschauers. Einige 
ihrer Exponenten - unter anderem Jean-Louis Baudry und Christian Metz, 
die sich intensiv mit dem Effekt der optischen Transformation auseinan- 


1 1949 wiederholt Balázs diese Textstelle fast wörtlich und kommt dort zum Schluss, 
dass deswegen kein künstlerischer Einfluss des Tonoperateurs möglich sei: «Wenn 
zwei Kameraleute verschiedener künstlerischer Eigenart dasselbe stürmische Meer 
photographieren, dann werden dessen beide visuelle Bilder sehr verschieden ausfal- 
len. Aber die akustische Darstellung des stürmischen Meeres bleibt im Wesentlichen 
die gleiche. Es werden sich bestenfalls solche Unterschiede zeigen, die aus technischen 
Ursachen entstanden sind. Der Tonoperateur hat nicht die Möglichkeit, den gleichen 
Ton, seiner künstlerischen Persönlichkeit entsprechend, auf verschiedene Art darzu- 
stellen» (1949: 224). 
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dergesetzt haben — gehen eigenartigerweise davon aus, dass der Ton im 
Lauf seiner technischen Bearbeitung nicht essenziell verändert werde. 
Stellvertretend seien hier drei wichtige Textausschnitte zitiert, die für die 
weitere Auseinandersetzung eine Rolle spielen: 


Und es ist wahr, dass man im Kino - wie bei allen anderen sprechenden 
Maschinen - nicht Abbildungen der Töne hört, sondern die Töne selbst. Die 
Aufnahmeverfahren mögen die Töne verändern, sie werden reproduziert 
und nicht simuliert. (Baudry 1975: 59) 


[...] wenn die Aufnahme gut gemacht ist, weisen die auditiven Daten gegen- 
über dem Geräusch aus der wirklichen Welt keinen phänomenologischen 
Verlust auf: Im Prinzip gibt es keinen Unterschied zwischen einem Schuss, 
den man in einem Film hört, und einem Schuss auf der Straße.? 

(Metz 1975: 158) 


Es macht keinen ontologischen Unterschied, ob man eine Geige in einem 
Konzertsaal oder als Tonaufzeichnung im Kino hört." (Mast 1977: 216) 


Selbst Ende der 1980er-Jahre taucht ein ähnlicher Gedanke bei Kittler (1988: 
57 ff.) noch auf, dort explizit mit dem Ziel zu beweisen, dass Tonmeister — 
die er in einem Atemzug mit Cuttern nennt, was verwundert - keine 
schöpferische Tätigkeit ausüben, sondern im Rahmen eines weitgehend 
automatisierten Prozesses höchstens eine steuernde Funktion innehaben. 
Weil also diese Konzeption so hartnäckig überlebt und weil sie außer- 
dem bis heute den Stellenwert des Sound Design in der Filmindustrie 
bestimmt, werde ich mich eingehend damit befassen. Am Anfang mei- 


2 «Et il est vrai qu'au cinéma, comme dans toutes les autres machines parlantes, ce n'est 
pas une image des sons, mais les sons eux-mémes que l'on entend. Les procédés d’en- 
registrement peuvent déformer les sons, ils sont reproduits, non simulés.» 

3 «{[...] les données auditives, à condition que l'enregistrement soit bien fait, n’accusent 
aucun déficit phénoménal par rapport au bruit correspondant du monde réel: rien ne 
distingue en principe un coup de feu entendu dans un film d’un coup de feu entendu 
dans la rue.» 

4 «There is no ontological difference between hearing a violin in a concert hall and hear- 
ing it on a sound track in a movie theater.» 

5 Im Gegensatz zu vielen anderen Berufen — darunter beispielsweise Maskenbildner 
und Casting — haben Sound Designer oder Supervising Sound Editors offiziell keinen 
Anspruch auf einen Titel im Vorspann und damit auch keinen Anspruch auf Urhe- 
berrecht, weil ihre Arbeit als nicht kreativ eingeschätzt wird (Beggs 1997). Es liegt im 
Ermessen einer Produktion, gegen diese Normen zu verstoßen. Regisseure mit eigenen 
Produktionsfirmen wie Coppola haben die Anweisung der Academy of Motion Picture 
Arts and Sciences während Jahren missachtet, wurden in letzter Zeit jedoch mit juristi- 
schen Mitteln gezwungen, diese Praxis wieder aufzugeben. 
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ner Argumentation beschäftige ich mich mit zwei Schriften, die gegen 
die Apparatus-Theoretiker opponieren, dann werde ich den Horizont auf 
einige grundsätzliche Überlegungen öffnen und am Schluss anhand einer 
detaillierteren Beschäftigung mit der zeitgenössischen Praxis und Techno- 
logie die Diskussion wieder konkretisieren. 


Die Gegenargumentation von Williams und Levin 


Es gibt hauptsächlich zwei Aufsätze, die sich gegen die Auffassung von 
Baudry, Metz und anderen wichtigen Filmtheoretikern stellen: Alan Wil- 
liams’ Is Sound Recording Like a Language? (1980) und Tom Levins The 
Acoustic Dimension (1984), deren Argumentation ich im Folgenden zusam- 
menfasse, weil sie als Ausgangsbasis für die weitere Auseinandersetzung 
dienen. 

Nach Williams’ Definition sind Töne «hörbare Luftschwingungen in 
Form von Wellenbewegungen in einer spezifischen räumlichen Konfigu- 
ration». Williams erkennt das Hauptproblem darin, dass Baudry Ton los- 
gelöst von seiner Produktion betrachtet. 


Baudrys Ion kann nur von Gott oder der Philosophie gehört werden. Für den 
Austausch mit dem Menschen muss in allen Fällen — auch bei Tonaufnah- 
men - das Medium berücksichtigt werden: Was vibriert, ist ein spezifisches 
Luftvolumen. (Williams 1980: 63) 


Aus dieser Betrachtung zieht Williams den für seine Argumentation ent- 
scheidenden Schluss, «dass identische Töne in verschiedenen akustischen 
Umfeldern verschieden erscheinen.»® Im täglichen Leben nimmt man 
diese Tatsache nicht bewusst wahr. Wir haben gelernt, davon zu abstra- 
hieren. Der Ton ist nicht nur verschieden in verschiedenen Räumen, son- 
dern auch in verschiedenen Positionen innerhalb des Raums. Der Ton als 
solcher ist das Resultat des Hörprozesses. Da der Ton aber immer von einer 
bestimmten Position aus aufgenommen wird, kann die Tonaufnahme 
nur eine spezifische Lesart des ursprünglichen akustischen Ereignisses 
sein. 


6 «Audible disturbances of air in the form of wave motion in a particular configuration 
of space.» 

7  «Baudry’s sound can be heard only by God, or by Philosophy. For human intercourse, 
in all circumstances, including sound recording, it is necessary to consider the medium: 
what vibrates is a particular volume of air.» 

8 «[...] that identical sounds seem different in different acoustical environments.» 
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Tom Levin stellt seine Überlegungen in einen größeren theoretischen 
Kontext als Williams. Er geht davon aus, dass die Transformation durch 
die optische Codierung erwiesen ist, seit Comolli und andere den Mythos 
der unschuldigen Abbildung zerstört haben. Diese Einsicht ist nicht in den 
Bereich des Akustischen vorgedrungen. «Diese Behauptung gründet auf 
der korrekten Beobachtung, dass die Beziehung zwischen Original und 
Abbild im visuellen Bereich anders gelagert ist als im akustischen»? (1984: 
57). Denn das akustische Original und die Wiedergabe weisen ähnliche 
physikalische Eigenschaften auf. Der Ton verliert bei der Abbildung keine 
Dimension. Baudry räumt zwar ein, dass der Ton durch den Aufnahme- 
und Wiedergabeprozess deformiert werde, ohne jedoch zu fragen, auf 
welche Weise und mit welchem Effekt. 


Metz (und im Weiteren auch die anderen oben aufgeführten Theoretiker) 
haben aufgrund von isolierten phänomenologischen Beobachtungen falsche 
ontologische Verallgemeinerungen vorgenommen («es erscheint mir real» 
wird zu «es ist real»). [...] Die Übersetzung von phänomenologischen Beob- 
achtungen in ontologisch begründete Behauptungen dient dazu, die ideolo- 
gische Auswirkung einer Darstellungspraktik unangreifbar zu machen und 
damit festzuschreiben.' (Levin 1984: 58) 


Levin nennt jede technische Entwicklung ein kompliziertes Wechselspiel von 
Ersatz und Mangel,” die zwar den Realismuseffekt erhöht, ihn jedoch auch 
gleichzeitig markiert. Comolli zitierend, meint er, dass die Künstlichkeit 
jeder Fiktion von vornherein bekannt sei und nur durch einen Mechanis- 
mus der Verdrängung akzeptiert werde, für den im englischen Sprach- 
raum die Bezeichnung voluntary suspension of disbelief etabliert ist. Nun 
wendet Levin sich jedoch - wie Williams - auch dem Raumbezug des Tons 
zu, der in einem Raum A produziert wird, um dann in einem Raum B wie- 
der aufzutauchen, weist jedoch darauf hin, dass der Zuschauer aufgrund 
seiner Hörerfahrung diese Differenzen ausblendet und die Ähnlichkeit der 
beiden Töne wahrnimmt, um sie zu verstehen. Dennoch sind die räumli- 
chen Charakteristika ausschlaggebend für den Unterschied: «Die räumli- 
che Besonderheit, die dem Ton seinen A-Effekt verleiht (d.h. die Tatsache, 


9 «This claim is based on the correct observation that there is a difference in the relation 
of the copy to the original in the visual and the acoustic domains.» 

10 «Metz (and by extension also the other theorists cited above) have made false ontologi- 
cal generalisations from isolated phenomenological observations («it seems real to me» 
becomes «it is real»). [...] The translation of phenomenological observations into onto- 
logical claims thus serves to perpetuate the ideological activity of a representational 
practice by holding it immune from critique.» 

11 «[...] a complicated alternation of supplementation and lack [...].» 
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dass Töne in verschiedenen Räumlichkeiten verschieden klingen), bedeu- 
tet, dass der wiedergegebene Ton stets vom Original abweicht»'? (1984: 62). 

Zwar rahmt die Aufnahme den Ton nicht in derselben Art und Weise 
wie das Bild, dennoch unterwirft sie ihn einem ähnlichen Prozess der 
Transformation. Die Tatsache, dass der Ton von einem Punkt aus aufge- 
nommen werde, meint Levin in Übereinstimmung mit Williams, zwinge 
ihm eine Perspektive auf, die auch durch den Einsatz mehrerer Mikro- 
fone, Hallgeräte und mehrerer Lautsprecher nicht beseitigt werde. Das 
Vorhandensein von Hörstreifen, wie Adorno/Eisler (1944) das Ensemble 
von Beeinträchtigungen auf der Seite der Wiedergabe durch Rauschen, 
Verminderung der Dynamik usw. genannt haben, verstärke noch den 
Eindruck der Kopie, auch wenn diese Beeinträchtigungen — wie Comolli 
sagt — wenig Bedeutung haben. Dass sie dennoch eine Rolle spielen, wird 
laut Levin durch die Tatsache evident, dass man an Stellen, wo der Ton 
fehlt, ein Stück aufgenommene Stille montiert, damit das Rauschen nicht 
plötzlich und auffällig aussetzt. 

Williams’ Argumentation ist eine echte Pionierleistung, die bis heute 
ihre Spuren in der Diskussion hinterlässt, auch wenn im Detail Wider- 
sprüche unter den Tisch fallen wie beispielsweise die Tatsache, dass sich 
das Ohr an die räumlichen Gegebenheiten weitgehend anpasst, wenn 
sie — wie im Kino - stabil bleiben. Auch die Definition des Tons mit der 
Einschränkung auf ein bestimmtes Raumvolumen ist nicht ganz korrekt. 
Es sind Töne denkbar, die nicht mit einem Raum in Beziehung treten. Die 
Sprünge, die Williams’ Argumentation noch aufweist, baut Levin Schritt 
für Schritt ab, und sein methodisches Vorgehen erscheint zugleich reich- 
haltiger und kohärenter. 

Beide Argumentationen bauen allerdings zu stark auf die räumliche 
Transformation auf. Es wären ja Verfahren denkbar, die diese räumliche 
Veränderung ausschalten. Oder es wäre denkbar, dass die physikalischen 
Eigenschaften von Original und Abbild vollständig übereinstimmen. Die 
technischen Innovationen zielen jedoch — wie in Kapitel 1 dargestellt — 
nicht darauf ab, akustische Ereignisse eins zu eins zu kopieren, weil das 
gar nicht wünschenswert ist. Dabei tritt nämlich der kuriose Effekt ein, 
dass der Hörer diese Form des Realismus als äußerst störend empfindet, 
weil er in krassem Gegensatz zu seiner Erfahrung und zu seiner Erwar- 
tung steht. Die Debatte um die raumlogische Bewältigung des Surround- 
Kanals (> 56) hat gezeigt, dass Konventionen - so absurd sie bei unvorein- 


12 «The spatial specificity which gives sound its A-Effekt (i.e. the fact that sounds are 
always different in different spaces) means that the reproduced sound is always differ- 
ent from the original.» 
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genommener Betrachtung auch erscheinen — unter Umständen über den 
Anspruch einer realitätsnahen Darstellung dominieren können. 


Der weitere theoretische Horizont 


In der Domäne der traditionellen mimetischen Künste - Literatur, Malerei 
und Theater - hat die Abbildungsdebatte eine lange Tradition, die bis auf 
Aristoteles zurückgeht. Mit wechselnden theoretischen Annahmen haben 
sich sehr unterschiedliche Argumentationen entwickelt. Häufig ging es 
dabei auch um grundlegende Fragen der tieferen Wesensart der Künste 
und um die Legitimation ihres Kunstcharakters. Tatsächlich ist dieser 
Diskurs von so vielen unterschiedlichen Positionen besetzt, dass es heute 
schon als Leichtsinn gilt, sich überhaupt dieser Frage zuzuwenden, wie 
Max Black (1972: 118) mit einem Augenzwinkern zu bedenken gibt. 

Die Schwierigkeit, sich mit der Abbildungsfrage auseinanderzuset- 
zen, hat in erster Linie methodische Ursachen. Unter anderem mischen 
sich philosophische Überlegungen mit psychologischen Gesichtspunkten. 
Entscheidend sind zudem die Präsuppositionen, auf denen die Argumen- 
tation aufbaut, und außerdem kommen eine Reihe begrifflicher Unschär- 
fen dazu, die damit zusammenhängen, dass dieses Territorium auch dem 
gesunden Menschenverstand zugänglich und damit von der ungenauen 
Begrifflichkeit der Alltagssprache weiter getrübt wird. Diesen Proble- 
men wird man nicht entkommen. Man kann jedoch die jeweils eigenen 
Grundannahmen durchleuchten und die Mehrdeutigkeit der Terminolo- 
gie abbauen." 

Als Grundbegriffe für die unterschiedlichen Auffassungen benütze 
ich das Vokabular von Williams und Levin, die zwischen Reproduktion 
und Repräsentation unterscheiden: Mit Reproduktion ist eine Gleichheits- 
beziehung zwischen Original und Abbildung gemeint, formelhaft ausge- 


13 Wichtige Impulse verdanke ich dem bereits erwähnten Max Black (1972), der sich mit- 
philosophischen Überlegungen zu Fotografie und Malerei befasst, außerdem Noel Car- 
roll (1988), der mit einem von Black inspirierten Instrumentarium philosophische Pro- 
bleme des Realismusbegriffs in der Theorie von Bazin behandelt, und Julian Hochberg 
(1972), der sich aus psychologischer Sicht mit dem Zusammenhang zwischen Kon- 
ventionen der bildnerischen Darstellung und der visuellen Wahrnehmung beschäftigt. 
Wie sofort deutlich wird, ist auch dieses Gebiet von der Domäne des Sehens geprägt. 
Ich kenne nur eine empirische Untersuchung zum Verhältnis von akustischer Reprä- 
sentation und auditiver Wahrnehmung, die im Rahmen einer Tagung des deutschen 
Tonmeisterverbandes vorgestellt wurde (Boss 1994). Außerdem werden dort und an 
anderen Kongressen von Berufsverbänden seit Jahren intensive Diskussionen zu ästhe- 
tischen Fragen der Tonaufzeichnung und Problemen des Urheberrechts diskutiert, die 
am Rande in meine Überlegungen einfließen. 
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drückt: A ist wie B («es gibt keinen Unterschied zwischen dem Schuss auf 
der Straße und dem Schuss im Kino»); der Begriff Repräsentation hingegen 
bezeichnet eine Beziehung, die eine Transformation nicht ausschließt: A 
klingt wie B; Abbildung schließlich verwende ich mit Black (1972: 116f.) als 
Oberbegriff, der beide Spielarten umfasst. 

Black (1972) zerpflückt eine Reihe von Kriterien des Abbildungspro- 
zesses, indem er aufzeigt, dass sie nicht hinreichend und teilweise auch 
nicht notwendig sind und dennoch alle eine Rolle spielen. Mit diesen Kri- 
terien werde ich mich zunächst einmal auseinandersetzen. 

Die Kausalitätsbeziehung steht im Rahmen der technischen Abbil- 
dungsprozesse an erster Stelle. Man geht als Zuschauer/Hörer davon aus, 
dass am Anfang eine Originalszene stand - ein Objekt oder Ereignis —, das 
als Sujet für die Abbildung dient, zum Beispiel der Schuss bei Metz oder 
die Violine bei Mast. Die Aufnahme wäre dann die Spur einer vergange- 
nen Wirklichkeit. Die Kausalitätsbeziehung ist jedoch — wie Black belegt 
(1972: 122 f.) - nicht hinreichend, weil sie allein keine getreue Wiedergabe 
garantieren kann. Die Tonaufnahme eines Schusses kann bei Übersteue- 
rung wie ein gigantisches Knattern klingen, bei Untersteuerung wäre hin- 
gegen nur ein leises «Plopp» zu hören. Es müssen aus dieser Sicht weitere 
konstitutive Kriterien berücksichtigt werden, welche die Möglichkeit des 
Misslingens unterdrücken. Zweitens ist die Kausalitätsbeziehung nicht 
notwendig; dies gilt im Besonderen für neuere Technologien der virtuellen 
Bild- oder Tonproduktion. Klangobjekte können am Synthesizer simuliert 
werden - zum Beispiel das Schlagen der Rotorblätter eines Hubschraubers 
oder das Sausen des Windes -, oder sie können auf einer aktiven Monitor- 
fläche zeichnerisch entworfen werden. 

An dieser Stelle kommen die Komponenten Information und Ähnlich- 
keit ins Spiel, die mit der Bedeutung der Abbildung zusammenhängen. Das 
potenzielle Misslingen einer Abbildung kann nur ausgeschlossen werden, 
wenn man die Bedingung stellt, dass die Aufnahme mit dem Original über 
inhaltliche Gemeinsamkeiten verfügt. Wie Carroll (1988: 132) darlegt, ist 
Wiedererkennen eine wesentliche Grundlage unseres Alltagsverständnis- 
ses von Abbildung. Black (1972: 128) hat für dieses Kriterium den Begriff 
substanzielle Information gewählt, der über die traditionell mathematisch- 
statistische Konzeption des Begriffs Information hinausgeht. Damit schließt 
er auch jene Erscheinungsweisen ein, die normalerweise als Fehlinforma- 
tionen gelten. Der Aspekt des Wiedererkennens nimmt implizit auf ein 
gegebenes Weltwissen des Rezipienten Bezug. Wir können nur wieder- 
erkennen, was uns schon einmal begegnet ist. Dieses Weltwissen kann die 
kinematografische Abbildung über ihre genuin mehrfach codierte Anlage 
auch selber erzeugen, indem ein Code eine Ähnlichkeitsbeziehung zu 
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bereitsetablierten Objekten, Verhaltensweisen oder Ereignissen herstellt. 
Das kann zum Beispiel die Sprache sein. Wenn von einem unbekannten 
Objekt gesagt wird, «dies ist ein Laserschwert», so ordnet die sprachliche 
Benennung das Objekt in ein bereits bestehendes Konzept ein. Unter dem 
Stichwort Mehrwert (> 142) werde ich mich an anderer Stelle detaillierter 
mit dieser spezifisch filmischen Bedeutungskonstitution befassen. 

Für die weitere Argumentation ist zunächst der Begriff Ähnlichkeit 
entscheidend. Unter Ähnlichkeit werden — wie Black (1972: 138) mit Bei- 
spielen illustriert — eine Vielzahl von unterschiedlichen Spielarten — von 
gleichartig über ununterscheidbar bis zu punktuellen Entsprechungen — ver- 
standen. Ob die Ähnlichkeit als hinreichend empfunden wird, kann nur 
unter Berücksichtigung des Zwecks beurteilt werden. Dazu ein Beispiel 
aus der Geschichte der Tonaufzeichnung: Bereits vor der Entdeckung 
der Hochfrequenzvormagnetisierung durch Weber und Braunmühl 1941 
(> 40) wurden Stahldrahtmaschinen in den 1920er-Jahren als Diktierge- 
räte, in den 1930er-Jahren mobile Magnetbandmaschinen für Spionage- 
zwecke hergestellt. Bei diesen Verwendungsformen stehen die Kausali- 
tätsbeziehung und die substanzielle Information im Vordergrund. Sie 
dienen dem Zweck der Dokumentation, der sich vom Zweck der Illusion 
unterscheidet, die das Kino braucht, um fiktive Welten darzustellen. Ich 
werde auf diesen Gedanken zurückkommen. Wenn virtuelle Objekte, 
Ereignisse oder Welten dargestellt werden, fehlt außerdem die Vergleichs- 
möglichkeit zwischen Original und Abbildung. Die Ähnlichkeitsbezie- 
hung orientiert sich dann an semantischen oder sensorischen Merkmalen. 

Also müssen wir eine weitere Größe in die Argumentation miteinbe- 
ziehen: die Intention. Die Intention ist im Rahmen der kinematografischen 
Abbildung besonders wichtig, weil sie eine übergeordnete Stellgröße ist, 
welche das Ensemble sämtlicher Erscheinungen koordiniert, um eben diese 
Fiktion herzustellen, die als Zweck bereits genannt wurde. Die Abbildungen 
sind nicht einfach da, sondern sie werden geschaffen, um im Kontext einer 
Narration interpretiert zu werden. Mir ist bei der gesamten Analyse meines 
Korpus kein einziges Geräusch eines Schusses begegnet, das nicht durch 
die Narration gerechtfertigt war. Niemals ist beispielsweise ein Schauplatz, 
an dem sich eine Liebesgeschichte entwickelt, zufälligerweise in der Nähe 
eines Schießstandes angesiedelt, obwohl ein solches Nebeneinander in der 
natürlichen Welt durchaus vorstellbar wäre und somit plausibel ist. 

«Das Kino erzählt ebenso, wie es abbildet, im Gegensatz zur Welt, die 
ein-fach da ist»'* (Gaudreault/Jost 1990: 14). Der kommunikative Aspekt 


14 «Le cinéma raconte autant qu’il représente, contrairement au monde qui est tout sim- 
plement.» 
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der filmischen Narration privilegiert die semantische Ebene gegenüber 
den sensorischen Dimensionen, die nur sekundär aufgeschlüsselt werden 
und doch für die Kinorezeption spezifische Eigenheiten aufweisen. 

Die Wahrnehmungssituation im Kino bleibt stabil, der Raum versinkt 
im Dunkel, die Töne tragen wenig bis keine Spuren des Kinoraums. Wir 
vergessen das Kino als realen Raum zunehmend. Baudry und Metz haben 
die Kinorezeption deshalb mit dem Traum verglichen. Grodal (1994: 
160 f.) widerspricht. Er ist der Auffassung, dass eingeschränkte motorische 
Tätigkeit eine Grundlage auch von vielen anderen, primär kognitiv orien- 
tierten, Aktivitäten wie Denken oder Schauen darstelle. Gemäß Grodal 
(1994: 161) ist Kinowahrnehmung nicht primär regressiv, wie in Baudrys 
und Metz’ Konzeption, weil die kognitive Evaluation der Wahrnehmungs- 
inhalte («dieses Verhalten finde ich unwahrscheinlich») und ihre aktive 
Exploration ebenfalls einen wesentlichen Bestandteil der Medienrezeption 
bilden. 

Im wirklichen Leben sind das homogene raumzeitliche Milieu und 
die Konstanz der Gegenstände gegeben. Der Film als narratives System 
muss die Fragmente so aufbereiten, dass sie eine kohärente Illusion schaf- 
fen. Die Diegese als sinnvolles Ganzes entsteht nur durch die konstruktive 
Tätigkeit des Zuschauers. Schon die Verbindung zwischen Objekt und 
Geräusch ist brüchig, die Verbindung zwischen Körper und Stimme der 
Filmfigur zumindest teilweise hypothetisch, und ein großer Teil der Ton- 
spur entfaltet seine Bedeutung nur in der Gesamtdramaturgie. 

Das Kino ist ein kulturell codierter Rahmen, indessen Ensemble auch 
die Tonspur erscheint. Die konstruktive Tätigkeit des Zuschauers bedeutet 
auch, dass er eine analoge Verbindung des Klangobjekts zu einer tatsächli- 
chen oder fiktiven Quelle unter Berücksichtigung der relevanten Reizquali- 
täten herstellen muss. Die Vertrauenswürdigkeit des technischen Apparats 
beruht laut Wuss (1993: 241) darauf, «dass er die Wirklichkeitsbeziehungen 
partiell korrekt abbildet und damit die grundsätzliche Manipulation ver- 
birgt.» Das Kino kann unter diesen Prämissen als eine extrem kontrollierte 
Umwelt verstanden werden, welche einer narrativen Instanz untergeord- 
net wird, die sich wiederum einer weiteren, allgemeineren signifizieren- 
den Praxis und ihren Konventionen anpassen muss (Wuss 1993: 290), zum 
Beispiel den ungeschriebenen Regeln des Mainstreamfilms. 

Damit kommen wir auf die Betrachtung des optischen Abbildungs- 
prozesses durch die Apparatus-Theoretiker zurück, die Vorstellung näm- 
lich, «dass das Medium selbst alles andere als ein neutrales Mittel sei, 
sondern selbst — quasi eingekapselt — die Botschaft enthalte, die es zu 
begreifen und für den Diskurs zurückzugewinnen gelte» (Winkler 1992: 
17). Wir müssen uns fragen, aus welchen Grundannahmen sie die Ansicht 


78 Abbildung 


abgeleitet haben, diese Mechanismen seien für die akustische Abbildung 
nicht relevant. Es ist unverständlich, dass Theoretiker wie Metz, dessen 
Behandlung des filmischen Sehens in Le Signifiant imaginaire (1975) so 
luzid ist, im akustischen Bereich so wenig differenzieren. 


Fallstudie: Die Prämissen von Metz 


Stellvertretend für andere möchte ich die Prämissen durchleuchten, wel- 
che die Grundlage für Metz’ Reproduktionsthese bilden." Er befasst sich 
in seinem Aufsatz Le Pergu et le nommé (1975) mit der Phänomenologie des 
Tons. 

Im Gegensatz zum visuell wahrgenommenen Objekt, das wir durch 
einen Namen eindeutig identifizieren können (zum Beispiel «die Lampe»), 
müssen wir — so Metz — die Benennung eines Tons doppelt codieren: 


In der Sprache als Metacode des Geräuschs ist die genaueste Identifikation 
offensichtlich dann gegeben, wenn sowohl der Ton als auch die Quelle be- 
nannt werden («ein Donnergrollen»). Wenn jedoch einer dieser Hinweise 
unterdrückt werden muss, kann eigenartigerweise jener auf das Klangobjekt 
selbst mit dem geringeren Schaden für den Wiedererkennungswert wegge- 
lassen werden.'® (Metz 1975: 155) 


Metz reduziert damit die auditive Wahrnehmung auf das sprachliche 
Erfassen der akustischen Erscheinung. Eine solche Sichtweise ist pro- 
blematisch. Es gibt einen Unterschied zwischen der sprachlichen und 
der sensorischen Wahrnehmung von Objekten, Orten und Handlungen. 
Kognitionspsychologische Untersuchungen unterschiedlicher Provenienz 
zeigen, dass Wahrnehmung sich auch außerhalb sprachlich fassbarer Kon- 
zepte abspielt, zum Beispiel in der Theorie von Jean Piaget (1936, 1966 
u.a.) oder von James Gibson (1979). Die Sprache hat ein sehr unzureichen- 
des Vokabular zur Beschreibung von akustischen Ereignissen hervorge- 
bracht. Wenn wir von einer «quietschenden Tür» sprechen, so ist eine fast 


15 Bei der sorgfältigen Lektüre der Werke anderer Vertreter der Reproduktionshypo- 
these — zum Beispiel Balázs (1930, 1949) oder Kittler (1988) — wird klar, dass ihre Über- 
legungen auf fehlerhaften Annahmen zu den Grundlagen akustischer Ereignisse, 
technologischer Möglichkeiten oder psychophysischer Gegebenheiten des Hörens auf- 
bauen. Weil ich es nicht für sehr produktiv halte, allen diesen Präsuppositionen einzeln 
zu widersprechen, konzentriere ich mich auf die Überlegungen von Metz. 

16 «Dans la langue comme métacode des bruits, l'identification la plus achevée est évi- 
demment celle qui désigne a la fois le son et la source («un grondement de tonnerre»). 
Mais si l'une des deux indications doit être supprimée, il est curieux de constater que 
c'est celle de l’objet sonore lui-même qui peut l'être avec le moins de dommage pour le 
degré global de reconnaissance.» 
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unendliche Zahl von akustischen Repräsentationen denkbar, die dieser 
Beschreibung entsprechen. Die auditive Erfahrung im Kino wäre ärmlich 
ohne alle nuancierten Schattierungen, die sprachlich nicht unbedingt zu 
fassen sind. Die Reizqualität als solche hat eine affektive, aber auch eine 
kognitive Bedeutung. Die sensorische Dimension des Klangs wird beson- 
ders auf zeitgenössischen Tonspuren ausgearbeitet, wie ich an entspre- 
chender Stelle zeigen werde (> Semantik erster Ordnung 121, Musikalisie- 
rung der Tonspur 264). Am deutlichsten wird sie in der Musik, die man als 
nicht referenziellen Code verstehen kann, das heißt, als ein bedeutungs- 
tragendes System, das sich nicht auf eine Wirklichkeit außerhalb seiner 
selbst bezieht. Hören wir eine Geige, so denken wir nicht unbedingt an die 
Quelle - die Geige als Objekt -, sondern konstruieren je nach Erfahrungs- 
hintergrund eine höchst individuelle Form der Bedeutung. Die massen- 
hafte Verwendung von unidentifizierbaren Klangobjekten im gegenwärti- 
gen Mainstreamfilm (> 126) ist ein weiterer Beleg dafür, dass Geräusche 
nicht nur unabhängig von ihrer sprachlichen Bewältigung, sondern auch 
unabhängig von einer konzeptualisierten Quelle wahrgenommen und 
interpretiert werden können. 

Das Grollen eines Donners, das Metz als Beispiel gewählt hat, ist bei 
genauer Betrachtung aufschlussreich, besonders weil es ein schlechtes Bei- 
spiel ist, wie er selbst einräumt. Das Wort «Donner» bezeichnet nämlich 
überhaupt keine Quelle, sondern bereits ihre akustische Emission. Die tat- 
sächliche Quelle des Donners ist die elektrische Entladung, die sich in der 
Atmosphäre vollzieht und als Blitz sichtbar wird. Die klangliche Bezeich- 
nung «Grollen» dient dem Zweck, einen spezifischen Donnertypus von 
einem anders klingenden — zu denken wäre beispielsweise an einen kra- 
chenden Donner - zu unterscheiden. 

Weiter meint Metz: 


Ideologisch gesehen ist die Klangquelle ein Objekt, der Ton selbst eine Eigen- 
schaft. Wie jede Eigenschaft ist er an das Objekt angeheftet, und darum reicht 
die Identifikation des Objekts aus, um das Geräusch zu evozieren, während 
das Umgekehrte nicht zutrifft. (Metz 1975: 156)"? 


17 «Idéologiquement, la source sonore est un objet, le son lui-même un caractère. Comme 
tout caractère, il est attaché a l'objet, et c'est pourquoi l'identification de ce dernier suf- 
fit a évoquer le bruit, alors que l'inverse n'est pas vrai.» 

18 Belton (1985: 64) treibt diese Sichtweise weiter: «Dem Ton mangelt es an <Objektivi- 
tät (und somit an Authentizität), weil er eine Eigenschaft und darum unvollständig 
ist.» («Sound lacks <objectivity> (thus authenticity) not only because it is invisible but 
because it is an attribute and is thus incomplete in itself.») Selbst Türschmann, dessen 
Dissertation zum Geräusch im Film erst 1994 erschienen ist, übernimmt Metz’ Defini- 
tion des Geräuschs als Eigenschaft des Objekts kritiklos. 
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Das Geräusch ist jedoch keine Eigenschaft des Objekts, sondern eine 
Möglichkeit. Es ist ein Spasmus des Objekts (Rosen 1955), eine energeti- 
sche Emission, die in physikalischer Beziehung zur Materie steht. In vie- 
len Fallen entstehen je nach Art und Weise, wie das Objekt zum Klingen 
gebracht wird, sehr unterschiedliche akustische Emissionen. Nehmen wir 
eine Tür, weil das Geräusch von Türen in vielen Filmen vorkommt. Man 
kann gegen Türen klopfen, man kann dagegenschlagen; Türen können 
quietschen, klacken und vieles andere mehr. Sie können außerdem sehr 
unterschiedlich beschaffen sein, was ihren Klang mit Klangfarben wie 
metallisch, hohl, holzig ebenfalls beeinflusst. Auf keinen Fall determiniert 
das Objekt allein den Klang, den es — oder vielmehr, den man mit ihm — 
produziert. 

Umgekehrt lässt sich an vielen Beispielen belegen, dass man Quel- 
len problemlos aufgrund von Geräuschen identifizieren kann, und zwar 
besonders dann, wenn ein entsprechender Erfahrungshintergrund vor- 
handen ist. Dem Vorgang der Identifikation ist in dieser Arbeit ein eige- 
ner Abschnitt gewidmet (— Identifikation einer Quelle 109). Wichtig ist an 
dieser Stelle der Hinweis, dass für die Identifikation der Rückgriff auf ein 
allgemeines Weltwissen nötig ist. Die mediale Abbildung von Klangobjek- 
ten auf der Tonspur greift jedoch in einigen Fällen gezielt auf die auditive 
Unsicherheit von Rezipienten zurück. Wenn Sound Designer Faustschläge 
vertonen, indem sie Gemüse klein hacken, können sie froh sein, dass die 
wenigsten Rezipienten vom Geräusch auf die Quelle schließen. 

Diese keineswegs vollständigen Überlegungen zum Verhältnis von 
Quelle und Geräusch belegen immerhin, dass diese Beziehung mehrdeu- 
tig ist und keinen einfachen Gesetzmäßigkeiten folgt, wie Metz annimmt. 
Besonders in meinen Überlegungen zum semantischen Aspekt (> Seman- 
tik erster Ordnung 100, Semantik höherer Ordnung 158) wird klar werden, 
dass die akustische Repräsentation auf der Tonspur ein eigenes Vokabular 
mit verschieden strukturierten Bedeutungsebenen entwickelt hat. 


Einen perzeptiven Reiz zu «verstehen» bedeutet nicht, ihn in allen Aspekten 
zu begreifen, sondern fähig zu sein, ihn zu klassifizieren, das heißt, in eine 
Schublade einzuordnen, das Objekt zu bezeichnen, von dem er eine Aktuali- 
sierung darstellt. Auch werden Geräusche viel eher nach den Objekten klassi- 
fiziert, von denen sie stammen, als nach ihren klanglichen Eigenschaften." 
(Metz 1975: 156) 


19 «<Comprendre> une donnée perceptive, ce n'est pas en saisir tous les aspects, c'est 
étre capable de la classer, de la mettre dans une case, de designer l’objet dont elle est 
une occurrence. Aussi les bruits sont-ils classés beaucoup plus d’apres les objets qui le 
sémettent que d'après leurs partages propres.» 
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Metz’ Diktum gilt nur für die sprachliche, nicht aber für die perzeptive 
Klassifizierung. Unter anderem hat Kotterba (1983) in seiner Dissertation 
aufgezeigt, dass Menschen über eine gut ausgebildete Klassifikationsfä- 
higkeit von Klangobjekten nach akustischen Merkmalen verfügen. In sei- 
ner Untersuchung stammten alle Klangobjekte von derselben Gattung von 
Quellen, wodurch eine Beeinflussung durch einvisuelles Vorstellungskon- 
zept, wie es Metz unterstellt, von vornherein ausgeschlossen war. 

Am Ende seiner Überlegungen holt Metz zum Zirkelschluss aus, dass 
das Klangobjekt nur ein Teil des visuellen Objekts, ein Infra-Objekt, sei, 
woraus sich die Hierarchie Sehen/Hören ableite. 


Man kann davon ausgehen, dass unsere ersten Wahrnehmungsqualitäten 
visueller und taktiler Natur sind; taktil, weil die Berührung traditionell das 
eigentliche Kriterium der Materialität darstellt; visuell, weil die für das All- 
tagsleben und die Produktionstechniken unentbehrlichen Anhaltspunkte 
sich stärker an das Auge wenden als an irgendein anderes Sinnesorgan.? 
(Metz 1975: 157) 


In diese Aussage fließt das kulturell bedingte Vorurteil, dass Erkennen 
mehrheitlich an die Modalität der visuellen Wahrnehmung gebunden sei. 
Aus entwicklungspsychologischer Sicht ist die Hierarchie nicht gegeben, 
denn in der menschlichen Entwicklung ist die auditive Wahrnehmung vor 
der visuellen ausgebildet. Neugeborene pfropfen visuelle Konzepte erst 
nachträglich auf bereits bestehende auditive Vorstellungen: das Bild der 
Mutter zur Stimme der Mutter. Vorherrschend wird die visuelle Wahr- 
nehmung vielleicht durch eine später erfolgende kulturelle Konditionie- 
rung. Eine wahrscheinlich minoritäre Bevölkerungsgruppe - Audiophile 
oder Ohrenmenschen genannt -, zu denen sich auch die Verfasserin dieser 
Arbeit zählt, unterschlägt Metz in seinen Betrachtungen. 


Phänomenologie und Bedeutung 


Metz’ Argumentation leidet an einer unartikulierten Vermischung von 
phänomenalen und semantischen Aspekten. Es geht also darum, das 
Phänomen - die psychophysische Reiz-Empfindungsrelation - von der 
Bedeutungsdimension - der kognitiven und affektiven Verarbeitung des 


20 «On peut penser que les qualités premières sont chez nous d'ordre visuel et tactile. Tac- 
tile parce que le toucher est traditionnellement le critère même de la matérialité. Visuel 
parce que les reperages nécessaires a la vie courante et aux techniques de production 
font appel a l'œil plus qu’à tout autre sens [...].» 


82 Abbildung 


Reizmaterials — zu trennen. Das ist jedoch nur bedingt möglich. In der 
menschlichen Wahrnehmung besteht eine untrennbare Interdependenz 
zwischen Phänomen und Interpretation, wobei in den Begriff Interpreta- 
tion - in Abgrenzung zu Metz — auch ein außersprachlicher Verstehenspro- 
zess einbezogen wird. 

Ein möglicher Schlüssel zu einer fundierteren Analyse des kinema- 
tografischen Abbildungsprozesses liegt darin, die phänomenale Trans- 
formation auf dem Hintergrund der aktiven Tätigkeit des wahrneh- 
menden Subjekts zu untersuchen. Die spezifische Wirkungsweise der 
Maschine Kino begünstigt phänomenologische Überlegungen, das heißt, 
Überlegungen zu den Wesenheiten der Dinge, wie sie uns erscheinen 
(siehe dazu Merleau-Ponty 1945: 3ff.). Denn der kinematografische 
Apparat ist seit Beginn an die Gegebenheiten des menschlichen Wahr- 
nehmungssystems angepasst. Wie Hochberg aufzeigt (1972), sind auch 
die Konventionen der bildlichen Repräsentation nicht arbiträr, also will- 
kürlich, sondern sie sind aus Funktionsweisen der visuellen Wahrneh- 
mung entstanden. Phänomenologische Überlegungen untersuchen die 
Mensch-Maschine-Symbiose auf der Folie der perzeptiven Strategien. 
Den Abbildungsprozess kann man so als ein Zusammenspiel zweier 
Transformationen verstehen. Der Apparat transformiert die physikali- 
schen Gegebenheiten in ein Reizangebot, das der Rezipient im Rahmen 
seiner angeborenen und erworbenen Wahrnehmungsmechanismen ent- 
schlüsselt und zu einer kohärenten Erfahrung zusammensetzt. Als wei- 
tere Determinante in diesem Prozess wirkt die kulturell codierte Praxis 
der filmsprachlichen Konventionen, die an einen wechselnden histori- 
schen Kontext gebunden sind. 

Die Hypothese, welche die folgenden Überlegungen leitet, geht 
davon aus, dass es sich sowohl bei der Abbildung als auch bei der Rezep- 
tion um komplementäre Transformationen handelt, die sich - sozusagen 
mit umgekehrten Vorzeichen - in der Summe wieder aufheben. Etwas 
vereinfacht könnte man die kinematografische Abbildung als Subtraktion 
bezeichnen - auf der optischen Seite deutlich als Verlust einer Dimension — 
und die Wahrnehmung des Zuschauers als eine Addition, welche diesen 
Verlust wieder ausgleicht. 

Wahrnehmung ist ein Übersetzungsprozess. Die internen Aktivitäts- 
relationen im Nervensystem führen zur Transformation einer Ausgangs- 
struktur. Die Ausgangsstruktur ist eine hypothetische Wirklichkeit, die 
sich hinter den Phänomenen verbirgt. Sie erscheint uns über energeti- 
sche Emissionen, zum Beispiel in Form von Licht- und Schallwellen. Das 
menschliche Wahrnehmungssystem übersetzt die physikalischen Reize 
aufgrund der Beschaffenheit der Sinnesorgane — angeborenen und erwor- 
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benen Strukturen — im Nervensystem in Empfindungen, sodass wir die 
Art, wie uns die Welt erscheint, nicht von der Geschichte unserer biologi- 
schen und sozialen Handlungen trennen können (Maturana/Varela 1984: 
27 f.). Grodal diskutiert einen ähnlichen Ansatz spezifisch im Hinblick auf 
die Medienrezeption: 


Die konstruktivistische Aktivität der Wahrnehmung bewegt sich innerhalb 
eines Rahmens, der von der Evolution vorgegeben wird. Darum ist es wich- 
tig, zwischen einer Arbitrarität zu unterscheiden, die durch die Evolution be- 
stimmt wird (wenn wir die Wahrnehmungsorgane der Fledermäuse hätten, 
würden wir die Welt anders sehen), und einer Arbitrarität, die durch soziale 
Praktiken entstanden ist.” (Grodal 1994: 74) 


Unter diesen Prämissen wird die Frage nach der Wirklichkeitsbeziehung 
einer Repräsentation neu aufgemischt. Denn das Abbild wird nicht nur 
von der Wahrnehmung bestimmt, sondern umgekehrt auch die Wahr- 
nehmung von den Abbildern, da sie sich in der menschlichen Erfahrung 
festschreiben. Einen Abbildungsmodus zu akzeptieren, ist ein kulturell 
bedingter Lernprozess. Die perspektivlosen Illustrationen des Mittelalters 
wurden zu ihrer Zeit wahrscheinlich als genauso realitätsnah wahrge- 
nommen wie heute ein einfaches Strichmännchen von einem Kind. Der 
Kinematograf mit seinen bewegten Bildern hatte eine Ikonizität erreicht, 
die nie zuvor da gewesen war. Die Tonspur musste also eine ähnliche Rea- 
litätsnähe erreichen, um akzeptiert zu werden. Die Geschichte des frühen 
Tonfilms belegt, dass die Menschen in einem größeren kulturellen Kontext 
erst einmal lernen mussten, die blechernen, zerkratzten Aufnahmen als 
Repräsentationen zu interpretieren, um sie in die fiktionale Illusion inte- 
grieren zu können. 

«Wiedergabetreue hängt einzig und allein von den Erwartungen 
ab...» (Bordwell/ Thompson 1979: 191): Die Geschichte des Filmtons 
illustriert diese These. Aus historischer Distanz ist es unverständlich, dass 
die rauschenden, kratzenden Emissionen des frühen Tonfilms oder früher 
Schallplattenaufnahmen als Reproduktionen der Wirklichkeit empfunden 
wurden. 

Fiktion aufbauen oder Illusion herstellen ist eine Gratwanderung, 
die unmittelbar mit der Abbildungsqualität zusammenhängt. Wenn Filme 


21 «Constructivism in perception works within a framework which is built-in by evolu- 
tion, and it is therefore important to distinguish between an arbitrariness built in by 
evolution (if we had senses like bats, we would see the world differently), and an arbi- 
trariness constructed by social means.» 

22 «Fidelity is purely a matter of expectations...» 
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asynchron laufen, wenn die Dialoge blechern und schwer verständlich 
klingen, bricht dieser fragile Prozess ein. 

Zu Beginn der Tonfilmzeit war die Speicherung des Schalls im 
Vergleich zur optischen Repräsentation in der Malerei und später in 
der Fotografie eine junge Erfindung. Dennoch gehen die Wurzeln der 
Legende von der unverfälschten Abbildung auf diese Frühphase der 
Tonproduktion mit ihrer deutlich transformierten Klangqualität zurück, 
wie die Aussage von Baläzs (1930) belegt. Akustische Ereignisse aus dem 
Raum-Zeit-Kontinuum herauszulösen, um sie zu einer anderen Zeit, an 
einem anderen Ort wiederzugeben, war eine Revolution. Seit der Jahr- 
hundertwende drang die technisch modifizierte Klangwiedergabe mehr 
und mehr in verschiedene Lebensbereiche des Menschen ein. Mitte der 
1920er-Jahre begann mit dem sogenannten Blatthaller, einem elektrody- 
namischen Lautsprecher, das Zeitalter der Großbeschallung (Schildbach 
1993: 111). Telefon, Rundfunk, Phonograph und Grammophon instal- 
lierten eine Wahrnehmungsqualität, die sich von der Wirklichkeit unter- 
schied, aber trotzdem etwas repräsentierte, das einmal da gewesen war. 
Der kulturelle Lernprozess wurde insbesondere vom Radio befördert. 
Die Klänge am Radio hatten eine andere Funktion als zuvor am Phono- 
graphen und am Grammophon. Sie illuminierten den Geist der Imagi- 
nation. 

Der Realismuseffekt ist einer irreversiblen evolutionären Dynamik 
unterworfen. Ein Beleg dafür sind die Remixes der STAR Wars-Trilogie 
und von Das Boor (BRD 1981, Wolfgang Petersen), welche die heute 
bereits wieder kümmerlich wirkenden Tonspuren der veränderten Erwar- 
tungshaltung des Publikums anpassen. 

Heute hat sich das Verhältnis umgekehrt. Immer mehr Informa- 
tionen über die Beschaffenheit der Welt stammen aus der mittelbaren, 
medialen Repräsentation. Der ätherische, wesenlose Klang von Laut- 
sprecheransagen in Flugzeughallen ist den Vorbildern aus den Science- 
Fiction-Filmen der 1950er-Jahre nachgebildet. Computersoftware bietet 
Toneffekte, welche im Stil von Cartoon-Sounds die Arbeitsschritte kom- 
mentieren. Schafer (1977: 110ff.) hat beispielsweise den Zusammenhang 
zwischen der Entwicklung der Lautsphären und Formen des musikali- 
schen Stils herausgearbeitet und zeigt auf, wie sich die Veränderungen 
der urbanen Klangwelt in der Musik niedergeschlagen haben. Maureen 
Turim (1989) beschreibt, wie der Flashback als Form der kinematischen 
Repräsentation von Zeitverschiebungen bis in unsere Alltagswahrneh- 
mung vorgedrungen ist und auch die Zeitgestaltung der Literatur maß- 
geblich beeinflusst hat. «Niemand wird leugnen, dass unser musika- 
lisches Weltbild nicht mehr am Klavier oder im Konzertsaal entsteht, 


Phänomenologie und Bedeutung 85 


sondern am CD-Player und an den diversen Empfängern medialer Akus- 
tikwelten» (Richter 1997: 53). Wenn Sound Designer Ende der 1970er- 
Jahre das perfekte Klangbild der Studioaufnahme planvoll zerstören, wie 
Murch berichtet (> 86), um mit den Mängeln des dokumentarischen Tons 
eine höhere Form der Authentizität auszudrücken, so reagieren sie damit 
auf den Konditionierungsprozess der medialen Abbildung. Denn der 
Realismuseffekt einer Tonaufnahme wird keineswegs durch die größt- 
mögliche physikalische Übereinstimmung zwischen dem Ausgangsma- 
terial und seiner Wiedergabe im Kino garantiert, sondern gehorcht einer 
Vielzahl impliziter Regeln. 

Die Eigenheiten der Transformation und die Verfälschung des Aus- 
gangsmaterials können durchaus ein besonderes ästhetisches Potenzial 
des Mediums bilden. Der kanadische Pianist Glenn Gould, der sich wie 
kaum ein anderer Interpret provokativ zur Ästhetik der elektrischen 
Klangaufzeichnung äußerte,” zog sich aus diesem Grund ganz aus dem 
Konzertsaalzurück, um nur noch im Studio zu musizieren. Für ihn hatte 
das Medium den Vorteil, das klangliche Material in einer Weise ana- 
lytisch zu zergliedern, wie dies in keiner Konzertsituation möglich ist. 
Solches Zergliedern konnte seiner Auffassung nach zum Beispiel in der 
Montage von einzelnen musikalischen Phrasen - in sich abgeschlos- 
senen dynamischen Bögen - aus verschiedenen Aufnahmen bestehen, 
wodurch jedes Moment eine eigene, autonome Atmosphäre entwickeln 
kann. Eine ähnliche Strategie der Interpretation durch die Technik sah er 
darin, Mikrofone so zu platzieren, dass ein unrealistisch luftiges Klang- 
bild entstand, in dem jedes einzelne Element aus dem Kontext heraus- 
gelöst erscheint. 

Zwischen Phänomen und Interpretation herrsche in der Wahr- 
nehmung eine Interdependenz, so die These, die ich zu Beginn dieses 
Abschnitts aufgestellt habe. Adaptive Prozesse der Gewöhnung führen 
zur Transparenz sowohl des Kinoapparats und des Kinoraums als auch 
der Wahrnehmung. Störungen sind nicht nur Teil der medialen Abbil- 
dung, sondern auch in der Alltagswahrnehmung vorhanden. Wir haben 
deshalb gelernt, durch sie hindurch wahrzunehmen, jene Teilaspekte des 
Reizangebots zu unterdrücken, die wir als Störung bewerten. Wahrneh- 
mung ist eine aktive, zielgerichtete Tätigkeit, die sowohl von äußeren 
Faktoren — der Reizbeschaffenheit — als auch von inneren Zuständen — der 
Motivation und der Antizipation — gesteuert wird. 


23 Seine Schriften sind 1984 unter dem Titel The Glenn Gould Reader erschienen (New York: 
Alfred A. Knopf); deutsch Glenn Gould: Vom Konzertsaal zum Tonstudio. München: 
Piper 1992. 
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Plötzliche Veränderungen hingegen ziehen unwillkürliche Auf- 
merksamkeit auf sich. Sie werden bei der medialen Repräsentation des- 
halb durch Blenden oder Überlagerungen versteckt, wenn sie nicht zur 
Bedeutungskonstitution beitragen. Unter anderem verschlechtert man die 
unerträglich perfekten Aufnahmen der Nachsynchronisation nachträg- 
lich. Man muss es zerstören, es künstlich altern lassen, es zerkratzen (Murchin 
Sturhahn 1974: 23).% Die plötzliche unmotivierte Verbesserung würde 
Aufmerksamkeit auf sich ziehen und eine Frage nach ihrer Bedeutung 
auslösen. 


Achten Sie darauf, wie diese irrsinnige Schallröhre scheinbar das Dümmste, 
Unnützeste und Verbotenste von der Welt tut und eine irgendwo gespielte 
Musik wahllos, dumm und roh, dazu jämmerlich entstellt, in einen fremden, 
nicht zu ihr gehörigen Raum hineinschmeißt — und wie sie dennoch den Ur- 
geist dieser Musik nicht zerstören kann. 

[x] 

Wenn Sie dem Radio zuhören, so hören und sehen Sie den Urkampf zwi- 
schen Idee und Erscheinung, zwischen Ewigkeit und Zeit, zwischen Gött- 
lichem und Menschlichem. (Hermann Hesse, Steppenwolf: 232) 


Der von Hesse beschriebene Urgeist überlebt die schrecklichsten Formen 
der akustischen Verstümmelung deshalb, weil er einen bedeutungstra- 
genden Kern enthält. Dieser Kern ist Teil der komplexen mentalen Reprä- 
sentation. Die stilisierten Klangobjekte der Hollywood-Klassik betonten 
die Bedeutungsebene, den oben beschriebenen Kern, gegenüber dem 
ästhetischen Mehrwert der Klanglichkeit aus Gründen der phänomenolo- 
gischen Instabilität des Apparats. Die Hörstreifen waren bis in die 1950er- 
Jahre, bis zur Einführung des Magnettons, immer noch so ausgeprägt, 
dass sie drohten, ins Bewusstsein zu gelangen. Die ausgeprägte Konzep- 
tualisierung blendete diese Gefahr aus. Erst mit der Verfeinerung der Auf- 
lösung konnte die Klanglichkeit ihren Stellenwert in der Architektur der 
Tonspur ausbauen. 

Die einzige mir bekannte empirische Untersuchung (Boss 1994: 
215ff.) zum Einfluss des Abbildungsmodus auf die Wahrnehmung kommt 
zum Schluss, dass sogar ein paradoxer Ausgleichsvorgang stattfindet, der 
die Störungen überkompensiert. Ich beschreibe die Untersuchung nur 
sehr summarisch, um diesen Sachverhalt zu illustrieren. Der Versuchslei- 
ter spielte einer Gruppe von Probanden, die aus Studenten und Professo- 
ren von Musikhochschulen zusammengesetzt war, zwei Interpretationen 


24 «You have to destroy that, antique it, scratch it.» 
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eines Werks vor und befragte sie nach der Bewertung der Interpretation 
anhand von Parametern, unter anderem Tempo, Artikulation, Dynamik, 
Phrasierung, Ausdruck und Stilgerechtigkeit. Die Probanden wussten nicht, 
dass sie zweimal dieselbe Interpretation hörten, die sich lediglich durch 
technische Verfahren unterschied. Die eine Version (B) wurde im alten 
Stil mit zwei Bändchenmikrofonen von 1930 in Mono aufgenommen, 
dem zusätzlich das Oberflächenrauschen einer alten Schellackplatte zuge- 
mischt wurde, die andere Version (A) mit den heute üblichen hochwer- 
tigen Kondensatormikrofonen in Stereo. Nur rund 20% aller Probanden 
bevorzugten die neuere Version A, rund 80% wählten Version B. Sogar 
objektive Parameter wie Tempo und Intonation, die physikalisch gesehen 
identisch waren, wurden unterschiedlich bewertet, und zwar zugunsten 
der älteren, verrauschten Aufnahme. Dieses paradoxe Resultat ist ein Hin- 
weis darauf, dass Hörer schadhafte Informationen in der inneren Vorstel- 
lung anreichern und dann mehr das eigene Vorstellungsbild als die äußere 
Wirklichkeit bewerten. 

Die Bedeutungsdimension spricht nicht nur die mentale Repräsen- 
tation an, sondern ist außerdem neben der räumlichen Positionierung der 
Schallquelle einer der stärksten Hinweise zum Aussortieren komplexer 
Geräuschmischungen. Diese Fähigkeit ist als Cocktailparty-Effekt bekannt, 
der erstmals 1950 durch den Akustiker Colin Cherry beschrieben wurde. 
Selbst in einer dichten akustischen Atmosphäre, wie sie in Restaurants 
oder eben an Cocktailpartys vorherrscht, sind Menschen in der Lage, 
einen Dialog zu führen, sogar dann noch, wenn das Grundgeräusch 
lauter als die Stimme des Gesprächspartners ist. Die Aufmerksamkeit, 
das Interesse steuert die zentrale auditive Prozessverarbeitung so, dass 
man das Gehör auf einen gewünschten Bereich fokussieren kann. Diese 
Fokussierungsfähigkeit — mit ihren Regeln werde ich mich im Abschnitt 
Aufmerksamkeit und Selektion (> 244) detaillierter auseinandersetzen - ist 
entsprechend stark mit psychischen Vorgängen verknüpft. Etwas verein- 
facht formuliert: Wir hören möglichst nur, was wir hören wollen. Diese 
Fähigkeit ist eng an die Bedeutungsebene der Sprache oder anderer akus- 
tischer Ereignisse gebunden. Fehlende Bruchteile werden aufgrund des 
Kontexts ergänzt. Der Prozess gründet auf dem grundlegenden Bedürf- 
nis nach verständlichen, sinnvollen Ganzheiten, das uns später bei der 
Behandlung narrativer Aspekte des Tons wieder beschäftigen wird. 
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Der kinematografische Abbildungsprozess besteht aus drei Phasen: Auf- 
nahme, Postproduktion, Wiedergabe. Das mittlere Glied dieser Kette, 
die Postproduktion, fehlt nicht nur in der theoretischen Begründung der 
mimetischen Abbildungsqualität bei Balazs, Baudry, Metz und anderen, 
sondern merkwiirdigerweise auch in der Argumentation von Williams 
und Levin. Sie alle untersuchen den einfachsten Fall: die monofone Auf- 
nahme eines einzelnen Klangobjekts mit nur einem Mikrofon sowie die 
monofone Wiedergabe der unbearbeiteten Aufnahme. 

Es ist methodisch sicher legitim, komplexe Sachverhalte zur theo- 
retischen Darstellung modellhaft zu reduzieren. Andererseits könnte 
ein Blick auf die praktischen Verfahren die Diskussion anreichern. 
Allein schon die genauere Kenntnis der Stereoverfahren (> 41) mit 
ihren Methoden zur Raumsimulation aufgrund psychophysischer Ein- 
sichten lässt das 1:1-Abbildungsverhältnis, das in der einfachsten mono- 
fonen Anordnung zumindest denkbar wäre, veraltet erscheinen. Auf 
der anderen Seite wird aus der Kenntnis der psychophysischen Mecha- 
nismen der auditiven Raumwahrnehmung klar, dass die Reduktion 
zweier Ohren einschließlich eines ausgedehnten Analyseapparats — des 
Gehirns - auf nur ein stellvertretendes Mikrofon nicht adäquat sein 
kann. 

Der Experimentalmusiker Alvin Lucier hat 1970 mit der von den 
Theoretikern bevorzugten 1-Mikrofon-1-Lautsprecher-Anordnung in 
spielerischer Weise eine Sprachaufnahme in einen Raum überführt. In I 
am sitting in a room different from the one you are in now liest er mit mono- 
toner Stimme einen Text, der mit diesen Worten beginnt. Anschließend 
spielt er die Aufnahme dieser Lesung im selben Raum über einen Laut- 
sprecher ab, nur um sie erneut über das Mikrofon aufzunehmen. Nach 
und nach verschwinden die bedeutungstragenden Einheiten der Sprache, 
lösen sich in einen Rhythmus auf, der mehr und mehr die Klanglichkeit 
des Raums übernimmt, bis der Raum im Rhythmus der ursprünglichen 
Sprachaufnahme zu singen beginnt. Man kann sich diese Raummusik 
nicht anhören, ohne zutiefst betroffen zu sein von der Metamorphose, 
die einem etwas so Altbekanntes, Vertrautes wie eine schlichte Sprach- 
aufnahme durch einen so durchsichtigen Prozess entzieht. Wie bei der 
stundenlangen Arbeit am Hallgerät oder in der schalldichten, hochab- 
sorbierenden Atmosphäre des schalltoten Raums fühlt man sich von der 
verfremdenden Transformation der Alltagswahrnehmung existenziell 
bedroht. 
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Was schließen wir daraus? Die Komposition von Lucier illustriert 
in sinnlich fassbarer Weise den Transformationscharakter einer einfa- 
chen akustischen Aufzeichnung, indem er den Prozess in einem unüb- 
lichen Maß wiederholt, bis die Transformation das Original vollständig 
beherrscht, oder wie Maturana/ Varela (1984: 76) formulieren: Genau dann, 
wenn eine Kopie so diffus wird, dass sie nicht mehr zu lesen ist, ist eine Abstam- 
mungslinie zu ihrem Ende gekommen. Auf die Interaktion von Phänomen 
und Bedeutung übertragen: Während in der ersten Kopie die Bedeutun- 
gen die Wesenszüge der Abbildung verbergen, verschwindet am Ende die 
Bedeutung hinter den Wesenszügen der Abbildung. 


Aufnahme 


Williams’ Auffassung, Mikrofone seien mehr wie Ohren als wie Räume 
(1980: 53), ist ein grundsätzlicher Irrtum, der sich durch einen großen Teil 
der Filmtheorie zieht, die den Mikrofonen geradezu magische Fähigkeiten 
zuspricht. Die biologische Analogie hat eine lange Tradition. Wie Bordwell 
et al. darstellen, war sie in den 1930er-Jahren unter Praktikern weit ver- 
breitet. 


In Kombination gleichen Kamera und Mikrofon einem eingeschränkten, aber 
lebensähnlichen menschlichen Körper. [...] Ausgehend von dieser Analogie 
ergeben sich viele Parallelen. Wenn die Photographie einäugig ist, muss die 
Tonaufnahme ebenfalls mit einem Ohr auskommen. Technische Anpassun- 
gen müssen dies kompensieren: Der Kameramann muss einen Eindruck von 
visueller Tiefe, der Tonmeister eine Tonperspektive erzeugen.” 

(Bordwell et al. 1985: 301) 


Das idealistische Verständnis von den anthropomorphen Zügen der 
Aufnahmemaschinerie ist noch in den 1930er-Jahren den pragmati- 
schen Zwängen geopfert worden. Spätestens dann, als die Forderung 
nach optimaler Sprachverständlichkeit eine natürlich erscheinende Ton- 
perspektive verdrängte und die fast lückenlose Musikbegleitung dem 
Geräusch eine undankbare Rolle am Rand zuwies, wurde die möglichst 
realitätsnahe Repräsentation durch eine konventionalisierte Hierarchie 
abgelöst. 


25 «Combined, camera and microphone resemble a limited but lifelike human body. [...] 
From this analogy there extend many parallels. Just as cinematography is monocular, 
sound recording must work with only one ear. Technical adjustments must compensate 
for this: the cinematographer must work to create an impression of visual depth and 
the sound recordist must create sound perspective.» 
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Mikrofone, das kann ich nicht genug betonen, sind vollkommen 
indifferente technische Apparate. Die Analogie Ohr — Mikrofon funktioniert 
sogar bei Kunstkopfmikrofonen, welche die anatomische Beschaffenheit 
des Kopfes und des Ohrs nachbilden, nur gerade in Bezug auf die Cha- 
rakteristik der Ohrmuschel und die geometrische Anordnung der beiden 
Mikrofone im Raum. Schon die Membran des Mikrofons unterscheidet 
sich wesentlich vom Trommelfell, mit dem wir sie vergleichen könnten. 
Unter anderem ist die Eigenaktivität des Ohrs als sogenannte otoakusti- 
sche Emission am Trommelfell messbar. Die kognitiven Prozesse determi- 
nieren das Ohr in seiner Funktionsweise weitestgehend, wie der oben dar- 
gestellte Cocktailparty-Effekt belegt. Das Ohr ist Teil eines kybernetischen 
Regelkreises. Anatomisch wird diese Fähigkeit durch das Vorhandensein 
sogenannter efferenter Fasersysteme ermöglicht, die umgekehrt gepolt 
sind und eine erregungshemmende Funktion haben. Sie motivieren die 
äußeren Haarzellen, die im Innenohr die akustischen Reize in neuronale 
Impulse umsetzen, zu einer Eigenbewegung (Keidel 1975: 13 f.; Buser/ 
Imbert 1987: 110) und filtern damit unerwünschte Frequenzbereiche aus. 
Selbst das hochwertigste Richtmikrofon ist nicht in der Lage, auch nur 
einen Bruchteil dieser fokussierenden Leistung zu erbringen, sondern 
wandelt einfach alle in der Achse liegenden Schallwellen, ungeachtet ihres 
Sinns und ihrer Zusammensetzung, in elektrische Impulse. 

Im Gegensatz zum Mikrofon ist das Ohr in verschiedenen Frequenz- 
bereichen unterschiedlich empfindlich. Während Bässe und extreme 
Höhen ab 12kHz relativ schlecht verarbeitet werden, ist die Empfindlich- 
keit in einem Bereich zwischen 3 und 5kHz am größten — einem Frequenz- 
bereich, der für die Sprachverarbeitung sehr wichtig ist. Die sogenannten 
Präsenzen, die hauptsächlich in den Konsonanten, zum Beispiel in den 
Zischlauten, zu hören sind, heben die Sprache aus den Umgebungsgeräu- 
schen hervor. Sie tragen damit zur Sprachverständlichkeit bei, die in den 
indoeuropäischen Sprachen zu einem großen Teil durch die Konsonan- 
ten vermittelt wird. Diese frequenzabhängige Empfindlichkeit des Ohrs 
ist eine Folge seiner evolutionären Anpassung an die Sprachproduktion 
(Details dazu sowie die notwendige Grafik werden im Kapitel Frequenz 
— 192 nachgeliefert). 

Auch die Analogie Mikrofon — Kamera, die Altman (1992a: 25) vor- 
schlägt, ist nicht sinnvoll. Der Fokussierungsgrad des Mikrofons lässt 
sich nicht mit demjenigen einer Linse vergleichen, sondern ist durch eine 
Reihe ganz anderer Charakteristika geprägt, von denen ich hier nur die 
Abhängigkeit des Bündelungsgrads von der Frequenz (hohe Frequen- 
zen werden stärker gebündelt) nennen will. Vor allem aber verhindern 
die spezifischen Abstrahl- und Diffusionsgesetze der Schallwellen, dass 
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Mikrofone jemals einen ähnlich hohen Selektionsgrad wie fotografische 
Objektive erreichen. Mikrofone sind niemals in der Lage, jene Bereiche 
der Lautsphäre vollständig auszufiltern, die nicht erwünscht sind, was 
bei der Kamera keine Schwierigkeit macht. Der Bildrahmen ist eine abso- 
lute Grenze zwischen jenem Teil der Welt, der in die filmische Repräsen- 
tation eingehen soll, und jenem Teil, den man in den meisten Fällen sorg- 
fältig aus dieser Repräsentation heraushalten will, wie beispielsweise 
das Mikrofon, die Scheinwerfer und die Menschen, die als Techniker und 
Regisseure den Film herstellen. 

Das Mikrofon fasst im Gegensatz zum menschlichen Ohr die phy- 
sikalischen Emissionen unabhängig von ihrer Relevanz zusammen. Es 
schafft eine später schwer trennbare Verbindung zwischen Phänomenen, 
die nichts miteinander zu tun haben. Am deutlichsten wird diese Verbin- 
dung durch die spezifische Verschmelzung von direktem Schall und akus- 
tischen Parametern des Raums. Abhängig von der Positionierung nimmt 
das Mikrofon eine bestimmte Relation zwischen Schallquelle und Raum 
auf. In der natürlichen Umwelt sind impulshaltige Schallemissionen und 
die akustischen Reaktionen des Raums klar voneinander unterscheidbar, 
in der Tonaufnahme fallen sie zusammen. 

Die Praxis, die Tonperspektive zugunsten der Sprachverständlich- 
keit und einer unauffälligen Kontinuität des stimmlichen Klangs zu ver- 
drängen, hat das Wesen der Tonaufnahme maßgeblich verändert. Die 
Raumparameter kann man nur durch eine rigide normierte Positionie- 
rung des Mikrofons in möglichst geringer Distanz von der Schallquelle 
ausblenden. 

Um in der Bildlichkeit von Subtraktion und Addition zu bleiben, die 
ich als Modelle für den Abbildungsprozess gewählt habe, handelt es sich 
bei der Aufnahme zu weiten Teilen um eine Subtraktion. Eine komplexe 
Klangsphäre muss auf jene Elemente reduziert werden, die im Rahmen 
der intendierten Narration zur Bedeutungskonstitution beitragen. In der 
amerikanischen Mainstream-Praxis bedeutet Originalaufnahme haupt- 
sächlich Dialogaufnahme. Sämtliche anderen Elemente der Tonspur wer- 
den in der Postproduktion einzeln gesucht und exakt platziert. 

Das akustische Material muss deshalb schon vor der Aufnahme 
bearbeitet werden, und zwar von Menschen. Schauspieler müssen ihre 
Stimme ausbilden, damit sie mikrofontauglich wird. Die akustische Umge- 
bung genügt selten High-Fidelity-Ansprüchen, denn sie produziert mehr 
und mehr ein unentwirrbares akustisches Zusammenspiel, das von eini- 
gen profan als Lärm bezeichnet wird. Sie muss in ihrer Komplexität gebän- 
digt werden. Ein ausgedehnter Produktionsapparat hat unter anderem die 
Aufgabe, störende Schallquellen am Set zu eliminieren, also brummende 
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Kühlschränke abzuschalten, Straßen zu sperren, Passanten zum Schwei- 
gen zu bringen. 

Die Signale, die das Mikrofon abgibt, sind von einer Interpretation 
durch den Menschen geprägt, nicht nur was die Manipulation der pro- 
filmischen Wirklichkeit anbelangt; ebenso wichtig sind Platzierung und 
Ausrichtung des Mikrofons. Zentimeter können darüber entscheiden, wie 
ein Objekt klingt. Jede Schallquelle hat eine spezifische, kaleidoskopartige 
Aura, die sich daraus ergibt, dass verschiedene Frequenzen unterschied- 
lich abgestrahlt werden. Die Kunst der Tonaufnahme besteht darin, die 
tiefere Wesensart und den Reichtum eines Klangs zu begreifen und aus- 
zudrücken. Charakteristika - beispielsweise der sonore Klang des Cellos — 
werden zeichenhaft überhöht und optimieren die Transparenz und Les- 
barkeit der Aufnahme. Außerdem gehört dazu, die akustische Umgebung 
richtig einzuschätzen, was das Verhältnis von Stör- und Nutzschall anbe- 
langt, und die Raumakustik so zu modulieren, dass sie das Klangobjekt 
optimal unterstützt. 

Jeder Mikrofontypus hat bestimmte Eigenschaften. Eine dieser Eigen- 
schaften ist die Richtcharakteristik (> 35). Die Richtcharakteristik ist 
jedoch keine absolute Größe, sondern abhängig von der Frequenz. Das 
bedeutet, dass seitlich oder rückwärts einfallender Schall auch bei einem 
Mikrofon mit hohem Bündelungsgrad klanglich verfärbt aufgenommen 
wird. Die klanglichen Charakteristika eines Mikrofons werden hauptsäch- 
lich durch diesen Faktor bestimmt. Heutige hochwertige Kondensator- 
mikrofone haben einen ebenen Frequenzgang oder allenfalls eine leichte 
Anhebung höherer Frequenzen zur Verbesserung der Sprachverständlich- 
keit. Bei ungeeigneter Positionierung sind die Verfärbungen des Mikro- 
fons jedoch so deutlich, dass sie Klangobjekte bis zur Unkenntlichkeit ver- 
formen. 

Anders als bei der optischen Abbildung kann man diese Eingriffe 
nicht aus der Aufnahme induzieren. Sie hinterlassen keine identifizierba- 
ren Spuren, sondern gleichen einer Blackbox-Operation, welche den Schall 
aufgrund einer dem Werk innewohnenden Intention in ein gewünschtes 
Signal überführt (vgl. Truax 1984: 8). Die Unhörbarkeit der klanglichen 
Transformation in der Aufnahme ist ein Grundpfeiler des Realitätseffekts, 
der offenbar so ausgeprägt ist, dass ihm auch namhafte Kritiker zum Opfer 
fallen. «[...] das klassische Paradigma will uns glaubenlassen, dass für den 
Ton, den wir wahrnehmen, keine Arbeit nötig war. Ton ist einfach da und 
strömt sozusagen aus den Bildern, die wir sehen» (Gorbman 1987: 75).”° 


26 «[...] the classical paradigm would have us believe that no work has gone in to the 
sound of what we witness. Sound is just there, oozing from the images we see.» 
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Die schöpferische Tätigkeit des Menschen schreibt eine subjektive 
Qualität in die Aufnahme ein. Das Subjekt des Filmtonmeisters koor- 
diniert alle physikalischen und technischen Gegebenheiten unter dem 
Gesichtspunkt des intendierten ästhetischen Ausdrucks. In der Praxis han- 
delt es sich dabei um eine Kombination von intuitiver und strukturieren- 
der, zielorientierter Tätigkeit.” 

Wuss (1993: 237) — der sich ausgiebig mit dem Abbildungsprozess 
des Kinos auseinandersetzt, die Tonspur als Element der Filmerfahrung 
aber merkwürdigerweise vollständig ausblendet - versteht die apparate- 
bedingte Transformation als Objektivierung, als ein Bloßlegen von Qua- 
litäten, die der menschlichen Wahrnehmung normalerweise verborgen 
bleiben. In dieser Sicht wäre das Mikrofon analog zur Kamera ein schär- 
feres Ohr. Eine solche Schärfung ist eine Konstante der Techniken von 
Aufnahme und Postproduktion. Die sauber herausgearbeiteten Aspekte 
unterscheiden das abgebildete Klangobjekt von seinem Ursprung. Die 
Differenz als solche hat eine kommunikative Funktion, ob sie nun bewusst 
wahrgenommen wird oder nicht. 


Postproduktion 


Die Postproduktion nimmt in der Tongestaltung des Mainstreamfilms 
den größten Stellenwert ein. In der Praxis des Hollywoodfilms handelt es 
sich bei der Postproduktion um eine ausgesprochene Unterbrechung des 
Abbildungsprozesses. Von Teilen des Dialogs abgesehen, stammt kaum 
ein Klangobjekt, das im Kino hörbar ist, von der im Film sichtbaren Quelle. 
Im unkompliziertesten Fall handelt es sich bei dem substituierenden 
Klangobjekt um ein Objekt des gleichen Typs, also um einen Hund, wenn 
ein Hund zu sehen ist. Sämtliche Spielarten der Verfremdung, die an ande- 
rer Stelle (> 277) ausführlich dargestellt werden, schieben sich zwischen 
das Original und seine Repräsentation. Bewegungsgeräusche der Figu- 
ren wie Schritte und Kleiderrascheln werden in der Mehrzahl durch den 
Geräuschemacher (Foley Artist) substituiert. Um auf das Beispiel Schuss 
zurückzukommen, das Metz gewählt hat: Es ist fast sicher, dass ein Film- 
schuss nicht von der Pistole stammt, die im Bild zu sehen ist. Der Klang 
des Schusses wurde entweder durch einen Schussgenerator erzeugt, vom 


27 Ich kann mich nicht genug gegen die Annahme zur Wehr setzen, die Technik als sol- 
che sei der bestimmende Faktor einer Abbildungsmodalität, wie sie unter anderem 
bei Kittler (1988) aufscheint. Die Technik als solche ist nicht mehr als ein Angebot zur 
ästhetischen Nutzung. Wenn sich auch genug Beispiele dafür finden lassen, in denen 
die technische Anordnung das Produkt beherrscht, kann daraus dennoch kein verall- 
gemeinernder Schluss gezogen werden. Die Meisterschaft drückt sich gerade darin 
aus, diese Limiten zu überwinden. 
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Geräuschemacher hergestellt, an einem anderen Ort aufgenommen, in 
digitalisierter Form synthetisiert, oder er stammt aus einem Geräusch- 
archiv, wobei der Sound Designer gewisse Regeln der Wahrscheinlichkeit 
und die Erwartungshaltung des Publikums berücksichtigen muss, um 
aus dem manipulierten ein glaubwürdiges Klangobjekt zu machen. Der 
Schuss ist ein besonders schlechtes Beispiel, weil man ausgerechnet dieses 
Geräusch sehr stark bearbeiten muss, damit es für die Wiedergabe tauglich 
ist, denn seine Dynamik ist so groß, sein Einschwingverhalten so steilflan- 
kig (> Hüllkurve 227), dass diese Parameter redimensioniert werden müs- 
sen, um im Ensemble einer Tonspur geniefsbar zu sein. Außerdem gehört 
dieses Klangobjekt zu jenen Erscheinungen, deren mentale Repräsentation 
in den Köpfen der Zuschauer stärker von der medialen Abbildung als von 
der Alltagswahrnehmung bestimmt wird. 

Die ursprüngliche Aufnahme - auch des substituierenden Klang- 
objekts - ist nur noch das Rohmaterial, das fragmentiert, über eine Reihe 
von komplexen Operationen bearbeitet, wieder zusammengesetzt und in 
einem elaborierten Schnittprozess in einen Dialog mit sämtlichen zusätz- 
lichen Klangobjekten gestellt wird. Alle klanglichen Parameter können — 
wie oben dargestellt (> Vom Sampler zur digitalen Workstation 63) — so 
modifiziert werden, dass sich der semantische Gehalt vollständig ändert. 
Wenn beispielsweise ein Sound Designer wie Beggs (1997) das Geräusch 
von riesigen Metallscheren, die in der Industrie Stahlbleche zuschneiden, 
in ein Geräusch des Atmens transformiert, dann greift er nur noch eine 
punktuelle Ähnlichkeit zwischen Original und intendiertem Abbild - den 
zweiphasigen Rhythmus - auf, die dem ungeschulten Hörer mit Sicherheit 
verborgen bleibt. 

Während der Tonmontage wird anschließend ein neuer Kontext 
geschaffen. Damit treten die einzelnen Klangobjekte unter dem Gesichts- 
punkt der ästhetischen Gesamtkonzeption in eine neue Beziehung zuei- 
nander und können so auch ihre Bedeutung ändern. 


Der Austausch von Information ist im Gegensatz zum Austausch von Ener- 
gie äußerst kontextabhangig. [...] der Kontext der ursprünglichen Quelle ist 
grundverschieden von dem des reproduzierten Signals. Das Konzept der 
Wiedergabetreue stellt die Qualität der Aufnahme ins Zentrum und lässt 
darum völlig außer Acht, dass der Kontext von Original und reproduziertem 
Ton nicht identisch sein kann.” (Truax 1984: 10) 


28 «The exchange of information is highly dependent on context, whereas the transfer 
of energy is not. [...] the context of the original source and the reproduced signal are 
entirely different. The concept of fidelity puts the emphasis on the quality of the sig- 
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Klangobjekte sind aus diesem einfachen Grund nach dem Schnittpro- 
zess nicht mehr das, was sie bei der Aufnahme waren. Die Montage ist 
eine konstruktive Tatigkeit, die einen ununterbrochenen physikalischen 
Datenstrom in perzeptive Einheiten unterteilt und neu kombiniert. 

Bei hoher Anzahl von Geräuschen entstehen neue Eigenschaften- 
der akustischen Umwelt. Die überlagerten Klangobjekte wirken wie 
ein neues Geräusch, das eigene klangliche Charakteristiken aufweist. 
Typisch für diesen Befund ist beispielsweise das Stimmengewirr in 
einem Restaurant, in dem sich die Sprache zu einem undurchdringbaren 
Geräuschteppich wandelt und ihre kulturell codierte Bedeutungsebene 
verliert.” 

Die Verschmelzungsprozesse der auditiven Wahrnehmung kön- 
nen Sound Designer jedoch auch gezielt nutzen, indem sie verschiedene 
Klangobjekte so überlagern, dass sie zusammenfallen und ein Perzept bil- 
den. Ein Beispiel dafür ist das Geräusch des Hubschraubers in Apoca- 
LYPSE Now (USA 1979, Francis Ford Coppola), das ich an anderer Stelle 
eingehender behandeln werde (> 289). Eine komplementäre Strategie 
besteht darin, die Unterschiede zwischen den einzelnen Klangobjekten 
zu betonen, um die perzeptive Trennung und damit die Lesbarkeit zu 
erleichtern. 

In der Praxis der Mainstream-Produktion zwischen 1975 und 1995 
herrscht eine Tendenz zum sensorischen Überfluss. Die abstrakten Reiz- 
qualitäten der Klangobjekte werden teilweise so massiv in den Vorder- 
grund gestellt, dass sie den Repräsentationscharakter zugunsten des Reiz- 
Reaktions-Mechanismus vollständig auflösen. Das gilt besonders für die 
Dimension des Pegels (> Lautstärke als expressives Stilmittel 237). 

Ebenfalls zur Postproduktion gehört die Mischung. Mischen heißt, 
die verschiedenen Elemente der Tonspur in Relationen zueinander zu 
setzen, einen Entwurf in eine feste Struktur überführen. Im Mischvor- 
gang werden die Klangobjekte hierarchisch, klanglich und räumlich 
sortiert. Mischen bedeutet deshalb nur bedingt Konstruktion, insofern 


nal, and therefore completely ignores the fact that there can be no «fidelity» in context 
between the original and the reproduced sound.» 

29 Dazu heißt es beispielsweise bei Baläzs (1930: 155): «Optische Eindrücke vermischen 
sich nicht. Erklingen jedoch mehrere Töne auf einmal, so verschmelzen sie zu einem 
Gesamtgeräusch. Ich höre kein Rechts und Links und kein Vorn und Hinten, ich höre 
keine Ausdehnung und keine Richtung des Raumes. Man braucht schon ein seltenes, 
absolutes Gehör dazu, um die einzelnen Töne wahrzunehmen.» Diese Bemerkung ist 
zwar partiell richtig, orientiert sich jedoch zu sehr an einer visuellen Vorstellung von 
Raum und ist selbstverständlich geprägt von den Begrenzungen der monofonischen 
Repräsentation, die damals üblich war und in welcher die Dimensionen des Raums 
nur rudimentär — hauptsächlich über Parameter der Lautstärke - wiedergegeben wer- 
den können. 
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als über eine Reihe von Peripheriegeräten von Kompressoren über Hall 
und ein hochkomplexes Arsenal von Filtern eine Reihe von klanglichen 
Eigenschaften des Materials erst in der Mischung geschaffen werden. 
Vielmehr kann man die Mischung als einen Prozess der Reduktion ver- 
stehen, der ein Übermaß an Reizen auf 200 Spuren in ein Verhältnis auf 
vier bis sechs Spuren überführt, genau abgestimmt auf die Kapazität des 
auditiven Wahrnehmungssystems des Menschen. Die Mischung simu- 
liert natürliche Mechanismen der menschlichen Informationsprozessie- 
rung, der Wahrnehmungs- und Aufmerksamkeitssteuerung, indem sie 
einzelne Elemente privilegierend in den Vordergrund rückt und andere 
der bewussten Wahrnehmung entzieht. Sie schafft einen kontinuierlichen 
Fluss in einem nahezu unüberschaubaren Angebot von heterogenem, 
fragmentiertem Material unter dem Gesichtspunkt der «größtmöglichen 
Natürlichkeit». 

Vor dem Hintergrund dieser Vorüberlegungen, die im Kapitel Wahr- 
nehmung komplexer akustischer Muster (> 244) weiter ausgebaut werden, 
wird deutlich, wie sehr die Feinabstimmung der Klangarchitektur in der 
Mischung die Wahrnehmung beeinflusst. Jedoch auch die kreativen Gren- 
zender Mischung werden ersichtlich: Es ist eine Binsenwahrheit der Ton- 
praxis, dass nur gemischt werden kann, was irgendwo auf einer der Ton- 
spuren montiert worden ist. 

Die Überbetonung von Pegeldifferenzen im Monolichtton der Hol- 
lywood-Klassik unterstützte die eindeutige Interpretation im Sinne einer 
Konzeptualisierung. Sie privilegierte einzelne Klangobjekte gegenüber 
anderen im Bemühen, die Bedeutungsebene auszubauen, um die Män- 
gel aus dem Bewusstsein auszublenden. Schafer (1977: 197) sieht in der 
Dynamik - der Stufung von Pegelunterschieden - als Organisationsprin- 
zip die Entsprechung zur monokularen Perspektive in der westlichen 
Malerei. Die monokulare Perspektive spielt in der ideologiekritischen 
Argumentation der Apparatus-Theorie eine Hauptrolle. Insbesondere 
Baudry (1970) schreibt ihr einen bedeutungstragenden Einfluss zu. Die 
Raumorganisation der Perspektive schafft ein hypothetisches Zentrum 
außerhalb des Bildes, das den Zuschauer als Subjekt in eindeutiger Weise 
positioniert. Es präsentiert uns die Idee eines hierarchisch strukturierten 
Universums. Baudry hat auf der Basis dieser Überlegungen die These 
aufgestellt, dass dem materiellen auch ein psychologischer oder kogni- 
tiver Blickpunkt im metaphorischen Sinn entspreche. Der ideologisch 
besetzten Repräsentation der Wirklichkeit ist der Zuschauer im Kino fast 
zwanghaft ausgesetzt. Es ist durchaus legitim, die dynamische Hierarchi- 
sierung der Tonspur, wie sie im Mischungsprozess geschaffen wird, mit 
Schafer in Analogie zur optischen Perspektive zu bringen. Sie kontrolliert 
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in ähnlicher Weise die Aufmerksamkeit des Zuschauers, indem sie auf 
eine spezifische, intendierte Lesart der komplexen Schichtung zielt. Diese 
eindeutige Strukturierung erfolgt im Hinblick auf die Regeln und Kon- 
ventionen der Wiedergabe im Kinoraum, mit denen ich mich unter den 
Stichworten Stereo (> 41) und Surround (> 56) schon ausführlich beschaf- 
tigt habe. 


Il Aspekte der Bedeutung 
von Klangobjekten 


3 Semantik erster Ordnung 


Beschreibung von Klangobjekten 


In unserer Kultur fehlt ein adäquates Vokabular zur Beschreibung von 
Klangobjekten. Diese Feststellung ist so trivial wie in ihren Konsequenzen 
weitreichend. Solange auditive Wahrnehmungen nicht in Sprache über- 
führt werden können, sind sie auch der Analyse nicht zugänglich. Die 
wiederkehrende Erfahrung, dass die Tonspur in allgemein theoriebilden- 
den Texten zur Filmästhetik konsequent ausgeblendet wird (zum Beispiel 
in Wuss 1993, Winkler 1992 oder Metz 1977, 1991), hat ihren Ursprung 
sicherlich weitgehend darin. Die fehlende Versprachlichung ist Aus- 
druck einer mangelnden Wahrnehmungsschulung im auditiven Bereich, 
aber nicht nur. Es gehört auch zu den genuinen Merkmalen akustischer 
Ereignisse, dass sie nicht a priori als fest umrissene, prägnante Einheiten 
erscheinen, sondern sich in Myriaden von Variationen im zeitlichen Konti- 
nuum des Klangflusses auflösen. Jede Beschreibung bleibt also notwendig 
eine Vereinfachung. 

Schafer, unter den Ohrenmenschen ein ausgesprochener Purist, stellt 
die sprachliche Bewältigung von auditiven Erfahrungen grundsätzlich 
infrage: 


Um eigene Klangeindrücke zu beschreiben, muss man Töne benutzen; jede 
andere Methode ist unlauter. Wenn wir Akustiker anklagen, Klangobjekte 
falsch wiederzugeben, wenn sie diese als Bilder darstellen, müssen wir auch 
Psychologen anklagen, wenn sie diese in Geschichten verpacken.' 

(Schafer 1977: 153) 


Schafers Diktum soll uns nicht davon abhalten, Strategien zu entwickeln, 
die den mehrdimensionalen Reizqualitäten von Klangobjekten möglichst 
weit entgegenkommen. Denn es ist eine praktische Notwendigkeit, Klang- 
objekte begrifflich zu erfassen, um sie zu analysieren. Die sprachliche 


1 «To report one’s impressions of sound one must employ sounds; any other method is 
spurious. Just as we accused acousticians of playing sound false by turning it into pic- 
tures, so we accuse psychologists of playing it false by turning it into stories.» 
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Benennung von Sachverhalten ist mit einer Zuordnung von Gegenstän- 
den zu Klassen verbunden. Es handelt sich dabei also um eine ordnende 
gedankliche Tätigkeit. Diese Tätigkeit strukturiert die aktuell anfallenden 
Sinnesdaten, indem sie von Details und singulären Zügen abstrahiert und 
phänomenal gleichartige Gebilde unter Nutzung gedanklicher Kategorien 
und modellhafter Vereinfachungen zusammenfasst (Schneider 1997: 49). 
Dabei ist der Vorgang als solcher von erkenntnistheoretischem Wert, 
indem die Vorgänge der Prädikation — der sprachlichen Benennung - «zu 
einer nicht mehr nur rezeptiven Aneignung von Wirklichkeit führen, son- 
dern zu Formen der begrifflich vermittelten Gegenstandskonstitution, die 
zugleich Ordnung und Gewissheit verschaffen soll» (Schneider 1997: 49). 
Je differenzierter die sprachliche Auflösung, desto differenzierter wird in 
ihrem Gefolge auch die Wahrnehmung und umgekehrt. 

Insbesondere bei der auditiven Wahrnehmung besteht ein Unter- 
schied zwischen implizitem und deklarativem Wissen. Implizites Wissen 
ist sprachlich nicht verfügbar, sondern dient alle in der Verhaltensregu- 
lation. Das deklarative Wissen hingegen ist Wissen im klassischen Sinn. 
Es ist ein sprachlich zugänglicher Bewusstseinsinhalt. Zur Entwicklung 
von analytischen Fähigkeiten bei der Arbeit mit Tonspuren ist es notwen- 
dig, subjektive Empfindungen in deklaratives Wissen umzuwandeln, das 
intersubjektiv zugänglich ist. Etwas einfacher formuliert: Die sprachliche 
Formulierung von Klangwahrnehmungen dient sowohl dem Zweck der 
Erkenntnis als auch der Kommunikation. 

Die didaktische Erfahrung mit Regie- und Filmwissenschaftsstuden- 
ten hat gezeigt, dass große Hemmungen bestehen, die intuitiven Empfin- 
dungen mitzuteilen, welche die Töne auslösen. Diese Hemmungen gehen 
auf das Bewusstsein eines dürftigen Erfahrungshintergrunds zurück. Zur 
Lösung dieses Problems hat sich ein modulares Beschreibungssystem 
bewährt, das sich am informationstheoretischen Modell der Differenzie- 
rung (differentiation) und Auflösung (resolution) orientiert. «Die verfüg- 
bare Information [...] resultiert aus der Kombination von Differenzierung 
und Auflösung, d.h., aus «was ist da» und «wie deutlich ist es zu erken- 
nem»? (Jaeger 1994: 13). 

Bei einer solchen Form der Beschreibung geht es darum, in mehreren 
Durchgängen Fragen an das Klangobjekt zu stellen. Die Antworten auf 
diese Fragen bilden die einzelnen Module, aus denen sich die Beschrei- 
bung zusammensetzen kann. Angesichts des weitverbreiteten Mangels an 
spezifischem Vokabular erscheint es sinnvoll, etablierte umgangssprach- 


2 «The information available [...] results from the combined effects of differentiation and 
resolution, i.e. from «what is there and from «how sharply is it seen.» 
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liche Begriffe anzuwenden. Diese Begriffe haben zwar den Nachteil einer 
gewissen Unschärfe, finden jedoch dank ihrer plastischen Anschaulichkeit 
selbst bei Schaeffer (1966) und Schafer (1977) Verwendung. Die Nutzung 
der Umgangssprache erscheint vielversprechend, wenn man bedenkt, 
dass sie zahlreiche zur Klangbeschreibung geeignete Wörter enthält, 
meint Thies (1982: 34), der sein System einer Typologie der Klänge aus- 
schließlich auf solchen Begriffen aufbaut. 

Nur physikalische Messungen blenden solche subjektiven Unschär- 
fen aus. Für Beschreibungen von Klangobjekten sind sie jedoch aus mehre- 
ren Gründen nicht geeignet. Einerseits steht die physikalische Gestalt nur 
in einem mittelbaren Zusammenhang zur perzeptiven Qualität — einem 
sehr komplexen Zusammenhang über dies, mit dem wir uns noch zu 
befassen haben —, andererseits hat man nur selten ein messtechnisches Ins- 
trument zur Verfügung. Außerdem bedarf es einer spezifischen Schulung, 
um messtechnische Resultate adäquat interpretieren zu können. 


a) Was klingt? 


Phylogenetisch - im Lauf der stammesgeschichtlichen Entwicklung des 
Menschen - war es immer eine Notwendigkeit, von Geräuschen auf 
Quellen zu schließen, in Sekundenschnelle zu entscheiden, ob es sich 
dabei um eine Beute oder einen Feind handelt, und adäquat darauf zu 
reagieren. Auch heute noch spielen solche weitgehend automatisierte 
Formen der Verhaltenssteuerung durch Geräusche eine Rolle, zum Bei- 
spiel im Straßenverkehr. Sie sind das Resultat lebenslangen Lernens auf 
der Basis der Integration von verschiedenen Sinneseindrücken. Visuelle, 
taktile und auditive Erfahrungen fließen in der Objektwahrnehmung 
zusammen. 

Chion (1990) nennt die suchende Form des Hörens écoute causale. Es 
ist eine konkrete Form des auditiven Abtastens einer Lautsphäre als Reak- 
tion auf die Frage: Was klingt? 

Der Name einer Quelle zur Bezeichnung eines akustischen Ereignis- 
ses kann als Label aufgefasst werden. Labels sind 


komplexitätsreduzierende Orientierungskriterien [...], um überschaubare 
und damit auch im Gedächtnis speicherbare Kategorien zu schaffen. Man 
kann dies als die Tendenz bezeichnen, Umwelttransparenz durch Reizklassi- 
fizierung zu erreichen. An die Stelle der Überbetonung von Unterschieden 
zwischen Sachverhalten tritt hier die Überbetonung der Ähnlichkeiten zwi- 
schen den Sachverhalten: Nicht mehr die einzelnen Sachverhalte, sondern 
die Gruppen von Sachverhalten werden unterschieden. (Lilli 1982: 14) 
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Es geht in diesem ersten Beschreibungsdurchgang darum, den kontinuier- 
lichen Klangfluss in einzelne Segmente aufzuteilen und diese Segmente 
in einem Prozess des Vergleichens groben Kategorien zuzuordnen. Ich 
möchte jedoch unbedingt darauf hinweisen, dass die Zuordnung eines 
Geräuschs zu einer Kategorie von Quellen eine zwar notwendige, aber 
keinesfalls hinreichende Voraussetzung für die weitere analytische Arbeit 
an der Tonspur darstellt. Die Bedeutung eines Geräuschs ist nicht zwin- 
gend mit der Bedeutung seiner Quelle identisch. Einerseits gehört zu 
den Grundkomponenten der klanglichen Bedeutungskonstitution, dass 
Klangobjekte äußerst kontextsensitiv sind; die Relationen zwischen den 
verschiedenen Elementen sind deshalb in vielen Fällen entscheidender für 
die Interpretation als die einzelnen Elemente an sich. Andererseits sind 
oftmals die klanglichen Aspekte bedeutungsvoller als die semantische 
Dimension der Quelle. 

Es besteht der berechtigte methodische Einwand, dass die begriffli- 
che Erfassung der Quelle nichts über die akustische Form eines Klangob- 
jekts aussagt. Die Klassifikation von Geräuschen aufgrund ihrer Quellen 
ist deshalb nicht mehr als ein Durchgangsstadium. Im Modell der Auf- 
lösung und Differenzierung handelt es sich lediglich um eine erste Stufe 
der rudimentären Konzeptualisierung, die ein Agens, einen Geräusch- 
verursacher, ermittelt. Die Genauigkeit, mit der eine Quelle sprachlich 
erfasst werden kann, hängt von verschiedenen Faktoren ab. Zum einen 
vom spezifischen Erfahrungshintergrund des Rezipienten, von seinem all- 
gemeinen Weltwissen, zum andern speziell bei der audiovisuellen Rezep- 
tion des Films von der zeitgleich auftretenden Visualisierung der Quelle. 
Diese Faktoren werden an anderer Stelle thematisiert (> Identifikation einer 
Quelle 109, — Ton/Bild 131). 

Nicht immer ist ein Agens zu bestimmen. In manchen Fällen bleibt 
die Quelle unbestimmbar (> Das unidentifizierbare Klangobjekt 126). 


3 Wolff (1995: 194) befasst sich mit den Klassifizierungsverfahren von Schallarchiven 

als Systematisierungen, die auf dem Vorhandensein gemeinsamer Merkmale von 
Geräuschquellen basieren. Die Strukturierung des Objektbereiches verfolgt dabei kein 
heuristisches Ziel, sondern dient lediglich der leichten Auffindbarkeit innerhalb der 
komplexen und teilweise schwer zugänglichen Schallarchive während des Produk- 
tionsbetriebs. Obwohl er solche Klassifizierungsversuche aus theoretischer Sicht für 
nicht überzeugend hält, baut er seine Analyse des Bedeutungsgehalts von Geräuschen 
auf Überlegungen zur Bedeutung der Quellen auf, die er in Geräuschfamilien (u.a. 
«Stadt», «Natur», «Fortbewegungsmittel») zusammenfasst. 
Die Auswertung sämtlicher erfasster Geräusche nach solchen Ordnungskriterien hat 
gezeigt, dass sie tatsächlich keine Relevanz für die wissenschaftliche Beschäftigung 
mit der ästhetischen Konzeption von Tonspuren zeigt, sondern nur triviale Erkennt- 
nisse liefert. Natürlich sind in einem Western viele Naturgeräusche zu hören, aber das 
führt nicht weiter, weil eben die Bedeutung des Klangobjekts von der Bedeutung sei- 
ner Quelle unterschieden werden muss. 
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b) Was bewegt sich? - 
Der Prozesscharakter der Klangerzeugung 


Klang ist untrennbar an Bewegung gebunden. Nur wo sich etwas bewegt, 
kann Klang entstehen. Das zweite Modul der Klangerzeugung bezieht 
sich deshalb auf diese Prozesskomponente. 

Der Sachverhalt ist relativ einfach, wenn es sich bei einem Agens um 
ein Lebewesen handelt, um ein Tier oder einen Menschen. Die Prozesse, 
die dort der Klangerzeugung zugrunde liegen, lassen sich hauptsächlich 
als Tätigkeiten oder stimmliche Äußerungen unterscheiden: Hunde bel- 
len, Schafe blöken, Pferde wiehern. Die nicht sprachlichen stimmlichen 
Äußerungen von Menschen umfassen eine reiche Palette von expressiven 
Lauten wie Weinen, Grölen, Jauchzen, Schreien, Lachen, Singen und vie- 
len anderen. Zu den prozeduralen Formen zählen insbesondere auch die 
zahlreichen Arten der Bewegung im Raum, die von Fahrzeugen im wei- 
testen Sinn oder von Lebewesen ausgeführt werden, also Schritte in allen 
Variationen, Fahren, Galoppieren. Menschliche Tätigkeiten - sichtbar oder 
unsichtbar — führen zu fast unbegrenzten Variationen der Klangerzeu- 
gung. Bei der Analyse von klanglichen Prozessen wird deutlich, dass das 
klingende Agens nicht mit dem handelnden Agens identisch ist. Nicht der 
Mensch klingt, wenn er eine Türe öffnet oder schließt, sondern die Türe, 
die sozusagen passiv eine Bewegung erleidet. In der unbelebten Welt sind 
die Prozesse häufig schwerer zu identifizieren, weil sie im Innern ablau- 
fen. Das Objekt als Ganzes erscheint statisch, während sich in seinem 
Innern Bewegungen abspielen: Die Festplatte summt im Computer, ein 
Klöppel schlägt gegen die Klingel im Telefon, eine Lautsprechermembran 
bewegt sich auf der Basis von elektrischen Impulsen. 

In vielen Fällen entstehen Geräusche durch die Interaktion zwi- 
schen Objekten. Dabei können entweder beide Objekte, das treibende und 
das bewegte, oder nur das eine Objekt in Schwingung versetzt werden. 
Schritte sind ein gutes Beispiel für eine solche Wechselwirkung: Sowohl 
das Schuhmaterial als auch der Untergrund sind zu hören. Ich habe eine 
Liste von Schritten zusammengestellt, die das Prinzip der Wechselwir- 
kung veranschaulicht: 


e knarzend von Lederschuhen (LADY HAMILTON, GB 1941, Alexander 
Korda) 

e von Kinderfüßen schleifend auf Holz (THE ALamo, USA 1960, John 
Wayne) 

e metallisch klirrend von Roboterfüßen (THE EMPIRE STRIKES Back, USA 
1979, Irvin Kershner) 
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e von flachen Füßen auf Holz ( E. T. — THE EXTRATERRESTRIAL, USA 1982, 
Steven Spielberg) 

° von flachen Füßen mit Lederquietschen (E. T. — THE EXTRATERRESTRIAL, 
USA 1982, Steven Spielberg) 

e von Holzschuhen auf Stein (AMADEUs, USA 1984, Milos Forman) 

° von riesigen Metallschuhen laut klackend (ALIENS — THE RETURN, USA 
1986, James Cameron) 

e von Robotern knirschend auf zerbrochenem Glas (RoBocor, USA 1987, 
Paul Verhoeven) 

° von Froschfüßen platschend auf Treppe (WHO FRAMED ROGER RABBIT?, 
USA 1988, Robert Zemeckis) 

e mit Knarzen von Leder und Klingeln des Schlüsselbunds (TERMINA- 
TOR 2, USA 1991, James Cameron) 

° sumpfig in auslaufendem Nitroglyzerin (TERMINATOR 2, USA 1991, 
James Cameron) 

° von Pferden im Schlamm (THE PrAno, Neuseeland 1992, Jane Campion) 

° leise schleifend auf Holz (THE PıAno, Neuseeland 1992, Jane Campion) 


Diese Sammlung von Schrittbeschreibungen greift der aktuellen Darstel- 
lung vor: Schritte von Holzschuhen auf Stein oder von Robotern knirschend 
auf zerbrochenem Glas weisen nicht nur auf Quellen oder Prozesse, son- 
dern prominent auch auf Materialien hin, die ich im nächsten Abschnitt 
beschreibe. 


c) Welches Material klingt? 


Klingende Materialien sind besonders leicht zu beschreiben. Die mate- 
rielle Komponente der Klangerzeugung ist vielleicht noch stärker genera- 
lisierbar als die Zuordnung des Geräuschs zur Quelle. Oder anders aus- 
gedrückt: Mehr noch als über die Art der Quelle informiert das Geräusch 
über deren materielle Beschaffenheit. Holz, Metall, Wasser, Stein oder 
Papier hinterlassen eindeutige Spuren. Nicht nur das Material, sondern 
sogar sein aktueller Aggregatzustand drückt sich im Klangobjekt aus, zum 
Beispiel Wasser als Dampf, als Regen, als Eis. Material und Quelle können 
auch zusammenfallen; dann ersetzt das Material eine morphologisch dif- 
ferenzierte Quelle. Luft zum Beispiel ist eine materielle Qualität, die auf- 
grund ihrer Beschaffenheit keine funktionale Form ausprägen kann, aber 
als Wind hörbar wird, wenn die Luft an anderen Objekten vorbeistreicht. 

Die materiellen Spuren sind für die Klangästhetik von besonderer 
Bedeutung und werden deshalb in einem eigenen Kapitel (> 330) thema- 
tisiert. 
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d) Wie klingt es? 


Im Gegensatz zur materiellen Beschaffenheit lassen sich die klanglichen 
Eigenschaften eher schwer sprachlich ausdriicken.* 

Die oben erwähnte Typologie der Klänge von Thies (1982) greift auf 
einen Katalog von klangbeschreibenden Verben zurück, der von Liebe 
1958 entworfen wurde und ursprünglich 1600 Wörter enthielt. Thies 
hat diesen Katalog auf 411 Adjektive reduziert. Viele dieser Adjektive 
beschreiben allerdings prozedurale oder materielle Komponenten von 
Klängen, die in dem vorliegenden Ansatz von der reinen Klanglichkeit 
unterschieden werden. Mir erscheinen hauptsächlich lautmalerische Ver- 
ben geeignet, um den klanglichen Aspekt sprachlich zu fassen. Sie werden 
in meinen Beschreibungen im Partizip Präsens adjektivisch gebraucht: 
also beispielsweise blubbernd, dröhnend, heulend, tosend, zischend. Lautma- 
lerische Ausdrücke sind deshalb geeignet, weil in ihnen die klangliche 
Ausprägung in sinnenhafter Form wiedergegeben wird. Anders gesagt: Es 
besteht eine Verwandtschaft zwischen Form und Inhalt, indem der Aus- 
druck selbst eine bildhafte Empfindung erzeugt. 

Problematisch ist die mangelnde Objektivierbarkeit von umgangs- 
sprachlichen Beschreibungen klanglicher Qualitäten. Es gibt keine objek- 
tiven Kriterien, nach denen beispielsweise tosend von brausend unterschie- 
den werden kann. Selbst bei der Verwendung durch ein und dieselbe 
Person können Schwankungen auftreten; mal wird ein Geräusch als sur- 
rend, mal ein sehr ähnliches als brummend bezeichnet. Dieses Problem ist 
prinzipieller Natur, weil es mit der Anforderung zur Echtzeitverarbeitung 
von Klängen zusammenhängt. Klänge können zum Vergleich nicht ange- 
halten und nebeneinandergestellt werden. 

Ein weiteres Problem liegt darin, dass manche dieser Verben sowohl 
Prozesse als auch Klanglichkeit ausdrücken, scheppern oder ächzen zum 
Beispiel sind Ereignisse mit spezifischen klanglichen Charakteristika. 

Einige Klangqualitäten werden direkt von Prozessen verursacht 
oder stehen in einer eindeutigen Beziehung zur physikalischen Beschaf- 
fenheit des Reizes. Dazu gehört der Dopplereffekt, der dann auftritt, 
wenn sich ein Objekt mit hoher Geschwindigkeit nähert und wieder 
entfernt. Er erzeugt eine melodiöse Struktur, die sich aus einem ersten, 
ansteigenden und einem zweiten, plötzlich abfallenden Teil zusammen- 
setzt. Die beschleunigende, dynamisierende Wirkung des Doppleref- 


4 Ich möchte nochmals darauf hinweisen, dass dieser scheinbare Nachteil ein wesentli- 
ches Fundament der emotionalen Reichhaltigkeit von klanglichen Eigenschaften dar- 
stellt. Weil sie sich der genauen Beschreibung entziehen, sprechen sie unterschwellig 
und ungefiltert die Emotionen an. 
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fekts spielt im Filmton eine große Rolle. In der Natur kommt er nur ganz 
selten vor, etwa bei vorbeifliegenden Insekten oder galoppierenden 
Pferden. Hingegen werden die Geräusche von Motoren in Flugzeugen, 
Autos, Motorrädern und Eisenbahnen mehrheitlich vom Dopplereffekt 
verändert. 

Auch die Ansiedlung des Klangobjekts in einem bestimmten Fre- 
quenzbereich kann so ausgeprägt sein, dass sie deutlich wahrnehmbar 
wird und deshalb nach Möglichkeit in die Beschreibung einfließen sollte, 
also bassig, mittig oder hoch. Dasselbe gilt für die Lautstärke — laut oder 
leise — und auffallende rhythmische Qualitäten, die einem Alltagsver- 
ständnis zugänglich sind, wie beispielsweise regelmäßig, hektisch oder 
beschleunigt. 

Eine weitere Gruppe objektivierbarer Klangqualitäten sind Zuord- 
nungen von Klangobjekten zu technischen Geräten: Radios, Lautspre- 
cheranlagen, Fernseher und so weiter. Im Grunde genommen handelt 
es sich dabei um eine Staffelung von Quellen. Für einen Applaus, der 
aus dem Fernseher erklingt, kommen sowohl die Menschen, die applau- 
dieren, als auch die Lautsprecher des Fernsehapparats als Quelle in 
Betracht. In erster Linie ist es jedoch die akustische Manipulation, die 
eine primäre Quelle anhand eines Bündels typischer Merkmale dahin- 
gehend transformiert, dass man sie einer sekundären elektronischen 
Quelle zuordnet.® 


5 Chion (1990: 68) hat für solche technischen Transformationen einen eigenen Begriff 

geschaffen: «Ich verbinde jene Geräusche mit dem Begriff on the air, die zwar von den 
Figuren in einer Szene zu hören sind, aber von Radio, Telefon, Lautsprecher wieder- 
gegeben werden und damit der «natürlich» erscheinenden mechanischen Schallaus- 
breitung entzogen werden. Mehr und mehr erhalten diese Töne, die aus Fernsehern, 
Autoradios oder Gegensprechanlagen klingen, einen spezifischen autonomen Status. 
Sie sind entweder in voller Lautstärke, klar und sauber, zu hören — wie wenn der Kino- 
lautsprecher direkt an das Radio, das Telefon oder den Plattenspieler in der Szene 
angeschlossen wäre. Oder sie sind im Dekor angesiedelt und werden durch spezifi- 
sche Färbungen gekennzeichnet, die einen Effekt von Entfernung, Hall oder Filterung 
durch die Lautsprecher schaffen. Zwischen diesen beiden Darstellungsformen finden 
sich alle Arten von Abstufungen.» 
(«On appellera sons sur les ondes (on the air) les sons presents dans une scene, mais sup- 
posés étre retransmis électriquement, par radio, telephone, amplification, etc. donc 
échappant aux lois mécaniques dites «naturelles» de propagation du son. De plus en 
plus en effet, ces sons de télévision, d’autoradio ou d’interphone acquièrent dans les 
films oü on les utilise un statut particulier autonome. On les fait entendre au spectateur 
soit plein cadre, clairs et nets - comme si le haut-parleur du film était directement bran- 
ché sur la radio, le téléphone ou le tourne-disque évoqué dans l’action; soit, à d'autres 
moments, localisés dans le décor par des traits acoustiques qui produisent un effet de 
distanciation, de réverbération et de coloration par les haut-parleurs, etc., avec une infi- 
nité de dégradés entre ces deux extrémes.) 
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e) Wo klingt es? 


Als letztes Modul fiir die Beschreibung von Klangobjekten soll die räum- 
liche Situierung betrachtet werden. Sie beinhaltet sowohl den Ort der 
Klangerzeugung als auch die akustischen Spuren des Raums. 

Der Ort der Klangerzeugung schreibt sich im Klangobjekt als räum- 
liche Distanz ein, beispielsweise nah oder entfernt, im Vordergrund oder 
Hintergrund. Die Entfernung ist nur bedingt eine Funktion der Lautstarke. 
Mit zunehmender Distanz verändert sich auch der Klang, er wird mitti- 
ger. Außerdem verändert sich das Verhältnis von direktem und diffusem 
Schall: Die diffusen Schallanteile nehmen zu und werden als Hall hörbar. 
Die physikalischen Details dieser Phänomene werden an anderer Stelle 
beschrieben (> Physikalische Aspekte der akustischen Raumrepräsentation 
300). Im Kontext der Beschreibung von Klangobjekten reicht es aus, sich 
auf die intuitive Wahrnehmung zu verlassen. Ist Hall hörbar? Welcher 
Raumtypus wird durch den Hall charakterisiert: Die langen Korridore 
eines Schulhauses, ein klein dimensioniertes gekacheltes Badezimmer, 
eine leere Fabrikhalle? 

Klangobjekte überwinden nicht nur Distanzen, sie dringen auch 
durch Wände. Die klanglichen Spuren der Hindernisse sind ebenfalls hör- 
bar und lassen sich somit auch beschreiben. Außerdem können Klangob- 
jekte im Stereoklangbild in der Horizontalen an verschiedenen Positionen 
angesiedelt sein — rechts, links oder in der Mitte —, oder sie können sich in 
der Horizontalen bewegen. 


Das semantische Differenzial 


Schwer fassliche Eigenschaften oder Bedeutungen, die der Intuition 
besser zugänglich sind als dem analysierenden Intellekt, werden häu- 
fig mit der Methode des semantischen Differenzials oder Polaritätsprofils 
untersucht. Diese Methode entstammt der empirischen Psychologie, 
wurde von Osgood 1952 entwickelt, von Hofstätter 1955 in Deutschland 
eingeführt und zuerst zur Analyse von Meinungs- und Persönlichkeits- 
strukturen eingesetzt. Das semantische Differenzial besteht aus einer 
Reihe von adjektivischen Gegensatzpaaren, die verschiedenen Empfin- 
dungen zugeordnet sind wie zum Beispiel stockend - fließend, schnell — 
langsam. In diesen Katalog tragen die Versuchspersonen ihre Eindrücke 
auf einer sechsstufigen Skala ein. Die Adjektivpaare sollen allgemein 
verständlich und möglichst nicht wertend sein. Nicht das Urteil steht 
im Zentrum des Interesses, sondern die psychologische oder ästhetische 
Wirkung. 


Identifikation einer Quelle 109 


Diese Methode hat den Vorteil, auch komplexe Wechselwirkungen 
und mehrdimensionale Reizänderungen zu erfassen, kurz: ganzheitlicher 
zu sein. Sie bedingt aber - und das schränkt ihre Anwendbarkeit stark 
ein - immer auch das Vorhandensein von mindestens zwanzig Versuchs- 
personen. 

Kotterba (1983) hat in Anlehnung an diese Methode ein Verfahren 
angewendet, bei dem die Versuchspersonen Klangeindrücke durch laut- 
malerische Begriffe beschreiben. Dadurch müssen Empfindungen nicht 
verbal abstrahiert, sondern können durch eine direkte akustische Analogie 
ausgedrückt werden: Einer solchen Wahl liegt die Annahme zugrunde, dass die 
Sprache bereits merkmalanalytische Vorarbeit geleistet hat (Kotterba 1983: 12). 

Allen mir vorliegenden Arbeiten, die auf dem Polaritätsprofil beru- 
hen, ist gemeinsam, dass sie nur einzelne Aspekte wie Rhythmen, Akkorde 
oder Motorengeräusche untersuchen, das heißt, dass der Versuchsleiter eine 
klassifizierende Auswahl getroffen hat. 


Identifikation einer Quelle 


Einfache sogenannte Blindfold-Tests, bei denen Probanden Quellen nur 
anhand von akustischen Spuren identifizieren müssen, belegen die gute 
Identifikationsfähigkeit des auditiven Systems (Höger/Bubeck 1986, Han- 
del 1989: 220, McAdams 1993a). Dennoch geistert bis heute in filmwissen- 
schaftlichen Texten das Vorurteil herum, dass Töne ohne das Bild ihrer 
Quelle nicht oder nur beschränkt identifiziert werden könnten, sogar in 
Texten, die sich ausschließlich mit der Tonspur befassen, unter anderem 
bei Chion (1990: 25f.) und Türschmann (1994: 63). 

Die Schärfe, mit der eine Quelle von anderen Exemplaren desselben 
Typs unterschieden werden kann, ist ein Resultat der sinnlichen Erfah- 
rung damit und der Relevanz, die dieser Quelle im Erleben eines Men- 
schen zukommt. So kann ein Bauer zwanzig verschiedene Hähne an ihrem 
Krähen erkennen (Wolff 1995: 125), ein Akustiker, der die Einwirkungen 
von Fluglärm auf die Bevölkerung untersucht, Flugzeuge aufgrund des 
Motorengeräuschs genauestens einteilen. Kinder, die bei mir zu Hause 
spielen, sind überzeugt davon, dass ich um die Ecke sehen kann, weil ich 
auch ohne Sichtkontakt immer genau weiß, was sie treiben; hingegen kann 
ich das Geräusch einer ferngesteuerten Zentralverriegelung nicht identifi- 
zieren, weil es nicht zu meiner Alltagswelt gehört. 

Die Wahrnehmung ist dort feiner strukturiert, wo ein reichhaltiger 
Erfahrungshintergrund besteht. Die genaueste Identifikationsleistung 
betrifft aus diesem Grund die menschliche Sprache. Wir erkennen die 
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Großmutter am Telefon auch dann nach wenigen Worten, wenn sie ver- 
schlafen nuschelt, erkältet ist oder eine Karotte knabbert. Für die Film- 
wahrnehmung ist diese Einsicht von einiger Konsequenz. Ohne diese 
Genauigkeit dürften Filmfiguren nur dann sprechen, wenn ihr Mund im 
Bild zu sehen wäre, und auch die neuere Tendenz zu einer souveränen, 
vom Bild weitgehend unabhängigen Tonspur wäre ohne die Fähigkeit zur 
auditiven Identifikation nicht denkbar. 

Damit ein Objekt identifiziert werden kann, muss im Gedächtnis ein 
Bündel von Merkmalen gespeichert sein, das dieses Objekt — zum Beispiel 
die Großmutter oder das Pferd — bezeichnet. Ein Grundproblem der Iden- 
tifikation ist es, dass von den aktuellen Veränderungen eines Objekts abs- 
trahiert werden muss. Das heißt, man muss das Objekt sozusagen durch 
die Störungen hindurch wahrnehmen. «Die Wahrnehmungen sind auf 
Wiederholbarkeit hin ausgelegt; sie werden erst durch ein Hinausgehen 
über die perspektivistische Bindung an den jeweiligen Standpunkt, durch 
eine Sprengung der Horizonte, produziert» (Straus 1956: 347). Somit ent- 
stehen mentale Repräsentationen der Objekte in einem mehrstufigen Pro- 
zess der Auseinandersetzung mit der Welt. 

Piaget, der sich sehr früh und sehr ausführlich mit der ontogeneti- 
schen Entwicklung von mentalen Repräsentationen theoretisch und empi- 
risch auseinandergesetzt hat (siehe dazu Piaget 1936 und 1966), geht davon 
aus, dass konkretes Handeln dem Gebrauch des Verstandes vorausgeht, ja 
ihn erst ermöglicht. Im Handeln werden verschiedene Sinnesmodalitäten — 
Sehen, Hören, Tasten, Schmecken - in Bezug auf spezifische Objekte koor- 
diniert. Erst mit Beginn der Sprachentwicklung entsteht die sogenannte 
Objektpermanenz, das Wissen nämlich, dass Objekte außerhalb ihrer aktu- 
ellen Verfügbarkeit weiter existieren, dass also ein Spielzeugauto weiter in 
der Welt bleibt, auch wenn es momentan unter dem Teppich verschwun- 
den ist. Diese Einsicht ist eine Voraussetzung für die Symbolfunktion. 
Unter Symbolfunktion versteht Piaget die Fähigkeit, einen Gegenstand 
durch einen anderen zu ersetzen, zunächst im Spiel als Nachahmung, spä- 
ter in Form von Sprache oder mental als abstrakte Vorstellung.° 

Es bildet sich also im Langzeitgedächtnis ein Muster heraus, das 
in abstrakter Form ein Objekt oder eine Klasse von Objekten repräsen- 
tiert. Aufgrund der wiederkehrenden Erfahrung mit einem akustischen 
Ereignis wird ein prototypisches Muster gebildet, das umso stabiler ist, je 
häufiger es aktiviert wird. Heute geht man davon aus, «dass Gedächtnis- 


6 Ich weise darauf hin, dass sich Piagets Symbolbegriff von meiner Verwendung unter- 
scheidet. In der vorliegenden Arbeit werde ich für diesen Sachverhalt den Begriff Zei- 
chen oder signifié verwenden, während der Terminus Symbol latenten Bedeutungen 
höherer Ordnung vorbehalten ist (> Symbole 163). 
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spuren verteilt repräsentiert werden, d.h., dass sie in einem Muster von 
Verbindungen zwischen einer großen Anzahl von Nervenzellen bestehen» 
(Goschke 1996: 366). Diese Muster von Verbindungen nennt man paral- 
lel distribuierte oder konnektionistische Netze. Ein solches Netz besteht aus 
einer Vielzahl von Knoten, die Merkmale repräsentieren. Diese Merkmale 
sind sehr kleindimensioniert. Goschke (1996: 381) nennt als Beispiel für 
die visuelle Wahrnehmung die Kanten und Bögen eines Buchstabens, für 
die auditive Wahrnehmung kann es eine bestimmte Frequenz sein. Diese 
Knoten werden über plastische Verbindungen (Konnektionen) miteinander- 
verschaltet. 


Jeder Konnektion ist ein Gewicht zugeordnet [...]. Das Gewicht legt fest, in 
welchem Ausmaß eine Verarbeitungseinheit eine andere beeinflusst, indem 
[die] Aktivierung, die eine Verarbeitungseinheit von einer anderen erhält, 
jeweils mit dem zugehörigen Verbindungsgewicht multipliziert wird. 
(Goschke 1996: 380) 


Merkmale, die sich ausschließen — zum Beispiel «rund» und «eckig» — sind 
über hemmende Verbindungen miteinander verknüpft. Aus den verschie- 
denen Potenzialen resultiert ein sogenannter Netto-Input, der in einer 
nicht linearen Transformation ein Aktivitätspotenzial generiert. 

Im Gegensatz zu früheren metaphorischen Vorstellungen des 
Gedächtnisses als eines Speichers, in dem Wahrnehmungsinhalte in fes- 
ter Form niedergelegt sind, werden im konnektionistischen Ansatz solche 
Muster jeweils neu reaktiviert. Je öfter sie aktiviert werden, desto ausge- 
prägter entwickeln sich die plastischen Konnektionen, welche die einzel- 
nen Knoten miteinander verbinden. Das bedeutet, dass mit zunehmender 
Erfahrung die Aktivierung dieses Musters immer schneller und automa- 
tischer verläuft. Dieser Befund wird später für die Diskussion von Stereo- 
typen (> 176) noch einmal wichtig sein. 

Zur Aktivierung — oder fachlich korrekter: zur Inhaltsadressierung — 
genügt ein Teil des ursprünglich erlernten Musters. Die fehlenden Teile 
werden im Prozess der Identifikation oder des Wiedererkennens ergänzt. 
Daraus erklärt sich, warum wir Objekte trotz zum Teil erheblicher Beein- 
trächtigungen oder phänotypischer Unterschiede erkennen können, wie 
oben geschildert die Großmutter. 

Eine Minimalvoraussetzung zur auditiven Identifikation einer Quelle 
ist das Vorhandensein spezifischer physikalischer Reizeigenschaften, die 
in einer regelhaften, typischen Gruppierung auftreten. Oder anders aus- 
gedrückt: Ein spezifisches Klangobjekt, zum Beispiel eine quietschende 
Tür, besteht aus einer Kombination von akustischen Merkmalen - unter 
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anderem Frequenzverteilung, zeitliche Ausdehnung und Lautstärke -, die 
es eindeutig charakterisieren. Einige dieser Merkmale sind obligatorisch, 
andere fakultativ. Die obligatorischen Merkmale sind notwendig, damit die 
quietschende Tür identifiziert werden kann. Wir können sie als Invarian- 
ten bezeichnen. Fakultative Merkmale - manche Autoren (z.B. Eco 1987) ver- 
wenden auch den Begriff akzidentielle Merkmale — charakterisieren weiterge- 
hende Eigenschaften einer spezifischen quietschenden Tür, beispielsweise 
bestimmte materielle Eigenschaften oder eine räumliche Situierung. Ein 
Prototyp zeichnet sich dadurch aus, dass er die obligatorischen Komponen- 
ten in einem idealen Verhältnis in sich vereinigt. Eine mögliche Erklärung 
des Identifikationsprozesses wäre, dass die mentale Repräsentation in einer 
solchen prototypischen Struktur vorliegt, die bei genügender Übereinstim- 
mung aktiviert wird (Handel 1989: 223, vgl. auch Goschke 1996: 380). 

Die ökologische Psychologie — prominent vertreten durch James J. 
Gibson — verwendet einen anderen Ansatz. Sie untersucht Wahrnehmung 
als aktive, zielorientierte Interaktion des Menschen mit seiner Umwelt. 
Gibson geht davon aus, dass die physikalische Beschaffenheit des Objekts 
und die damit verbundene Funktion dem Individuum direkt als Informa- 
tion zur Verfügung steht. Wahrnehmung wird unter dieser Prämisse nicht 
als konstruktivistische Integration verschiedener Merkmale verstanden 
wie im Modell des konnektionistischen Netzes. Vielmehr versteht Gibson 
sie als Informationsentnahme, bezogen auf die biologische oder hand- 
lungsbezogene Relevanz. 

Ausgehend von Gibsons Ansatz, der sich hauptsächlich mit der visu- 
ellen Wahrnehmung auseinandersetzt, hat Knaus die auditiven Identifika- 
tionsverfahren empirisch untersucht: 


Bei allen Vergleichen fielen die Latenzzeiten der Objektbezeichnungen gerin- 
ger aus [als jene der Merkmalsbeschreibungen]. Somit lässt sich festhalten, 
dass der Ansatz von Gibson, in welchem mehrdimensionale Reizinformatio- 
nen direkt und zeitlich vor den einzelnen Dimensionen oder Eigenschaften 
eines Reizes wahrgenommen werden, auch für den auditiven Bereich seine 
Gültigkeit hat. (Knaus 1994: 126) 


In der Alltagswahrnehmung ist diese Form der auditiven Identifika- 
tion fest verankert. Es besteht eine Tendenz, das Ganze vor seinen Teilen 
zu identifizieren. Etwas vereinfachend illustriert: Wiehern, Schnauben, 
Galoppieren werden der Quelle Pferd zugeschrieben, nicht dessen Maul 
oder Hufen. In Einklang damit steht auch die Feststellung, dass einige 
Übung notwendig ist, um die Aufmerksamkeit nicht auf das Klangobjekt 
als Ganzes, sondern auf einzelne Komponenten zu richten. 
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Der Hang zur Generalisierung ist in der auditiven Wahrnehmung 
eher ausgeprägter als in der visuellen. Sehr häufig wird ein Typ (type) eines 
Objekts identifiziert, nicht ein bestimmtes Exemplar (token), also ein Hund, 
nicht ein bestimmter Dackel. Dies gilt vor allem für kontextfreie Situatio- 
nen. Sobald ich aber durch die Decke meiner Wohnung ein Schaben von 
Krallen auf dem gekachelten Fußboden höre, identifiziere ich Tosca, die 
Hündin meiner Nachbarin Susanne. Diese Genauigkeit ist eine Folge des 
Wahrnehmungslernens, sowie der Integration verschiedener Wahrneh- 
mungsmodalitäten und sprachlicher Aussagen über das Objekt und den 
Kontext auf dem Hintergrund unseres allgemeinen Weltwissens. 

Manche Klangobjekte weisen ein prägnantes Muster auf - zum 
Beispiel das Miauen einer Katze - andere sind an sich eher unscharf. 
Schulte-Fortkamp (1994: 161) hat Probanden das Geräusch eines Druck- 
luftschleifers zugespielt, das sie klanglich als laut singend beschreibt. Die- 
ses Geräusch wurde als Zahnarzt, Bohrer, Kreissäge, Kettensäge, Holzarbeits- 
säge interpretiert. Alle diese Interpretationen sind in einem engeren Feld 
von kontinuierlichen, motorisierten Klangerzeugern angesiedelt, denen 
eine eher negative emotionale Bewertung zukommt. Probanden, die keine 
Quelle identifizieren konnten, schrieben dem Geräusch nur diese emotio- 
nale Qualität zu: Furchtbar, das war so mit das Schlimmste. 

Fiktive Quellen müssen im Film erst etabliert werden, damit die 
Zuschauer sie auditiv identifizieren können. Typischerweise werden sie 
entweder gezeigt oder sprachlich benannt: «Die Dylithiumkristalle wer- 
dengleich tibersteuern»’ (STAR TREK — THE MOTION PICTURE, USA 1979). 
Das Wissen der Rezipienten über viele Quellen stammt ausschließlich aus 
der Filmwahrnehmung. Die wenigsten haben in ihrem Leben schon Quer- 
schläger, Kriegsdetonationen oder Echolote gehört, ganz zu schweigen von 
futuristischen Raumstationen, Sonnenstrahlen oder der Stimme Gottes. 


Fallstudie: Türen 


Auf der Grundlage der Überlegungen zur Objektbeschreibung und Objekt- 
identifikation in den Abschnitten Beschreibung von Klangobjekten (> 100) 
und Identifikation einer Quelle (> 109) werde ich im Folgenden in einer Fall- 
studie die Frage diskutieren, inwiefern sich die klangliche Darstellung von 
einzelnen Objekten im klassischen Hollywoodfilm von der Darstellung im 
zeitgenössischen Mainstreamfilm unterscheidet. 

Als Gegenstand der Untersuchung habe ich das Geräusch von Türen 
gewählt. Türen sind deshalb geeignet, weil sie einerseits ein klar abgrenz- 


7 «The dylithium crystals are going to overload.» 
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bares, eindeutiges Objekt darstellen, andererseits aber in besonders reich- 
haltiger Vielfalt vorkommen können. Die obligatorischen Merkmale von 
Türgeräuschen sind relativ beschränkt auf das Geräusch des Schließens, 
ein perkussives kurzes Geräusch, das mit dem Gewicht, der materiellen 
Beschaffenheit und der Kraft, die auf die Tür ausgeübt wird, innerhalb 
gewisser Grenzen variieren kann. Die fakultativen Merkmale hingegen 
sind sehr breit gefächert. Sie betreffen die physikalischen Eigenschaften 
Material, Volumen und Masse, die Prozessqualitäten von dezentem Öffnen 
bis dramatischem Zuschlagen, die Beschaffenheit des Schlosses, eventu- 
elle automatische Mechanismen sowie die räumlichen Eigenschaften des 
Ortes, an dem die Türe sich befindet; sie umfassen also alle im Beschrei- 
bungsmodell vorgestellten Module. Dank der breit gefächerten fakulta- 
tiven Merkmale bieten Türen ein ausgeprägtes Potenzial für die kreative 
Ausgestaltung, die sich nur lose an die visuelle Darstellung anpassen 
muss. Auch in Europa werden sie speziell bei Drehs im Studio während 
der Postproduktion ersetzt, da die Bauweise der Kulisse ausschließlich auf 
die optische Qualität ausgerichtet ist. 

Als narrative Elemente des Films spielen Türen ebenfalls eine Rolle. 
Sie produzieren handlungsgebundene Geräusche, die eine erzählerische 
oder informative Funktion haben. 

Die ausgewählten Filme sind in ihrer jeweiligen Ausprägung extreme 
Vertreter von historisch verankerten Tendenzen, die sich während der ana- 
lytischen Arbeit am Korpus herausgeschält haben. 


a) Türen in THE Big House (USA 1930, George Hill) 
e Autotür zuschlagen 
e Gittertor aufschließen 
° Metallgittertür aufschließen 
e metallisches Klacken einer Gittertür (4) 
e Metallschiebetürleiseschleifend 
e Metallschiebetür schwer (2) 
e Metalltür schwer 
e Metalltür groß schleifend 
e Schiebetür 
e° Türe zuklackend im Hintergrund 
° Türe zuklappen 


THE Bic House ist eine Produktion der MGM und einer jener frühen Ton- 
filme, die in bemerkenswerter Weise die technischen Beschränkungen des 
Apparats überwinden und besonders auch auf der Tonspur eine beein- 
druckende Anzahl kühner Einfälle integrieren. Als früher Gefängnisfilm 
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installiert er eine Reihe von genretypischen Elementen. Dazu gehören die 
unvermeidliche große Metalltür und das Metallgittertor, die bis heute das 
Setting Gefängnis charakterisieren. Geräusche von Türen machencirca 
8,3% aller beschriebenen Geräusche aus. Auf die Betonung des metalli- 
schen Klangaspekts, der in THE Big House allgemein zu beobachten ist, 
werde ich im Abschnitt Metall (> 353) näher eintreten. 


b) Türen in Witson (USA 1944, Henry King) 
e Lifttür bassig rumpelnd (4) 
e Tür dezent (2) 
e Tür angedeutet 
e Tür auf und zu gedämpft 
e Tür im Hintergrund (4) 
e Tür klappernd (5) 
e Tür leise (4) 
e Tür leise klappernd 

Tür scheppernd 

Tür zuschlagen (2) 


WILSON gehört zum Genre der filmischen Biografien, auch Biopics genannt. 
1944 - in der letzten Phase des Zweiten Weltkriegs — entstanden, trägt der 
Film ausgesprochen patriotische Züge. Präsident Wilson, der während des 
Ersten Weltkriegs heroisch und unerschrocken die schwierigsten Situa- 
tionen meistert, wird vorwiegend im Weißen Haus im Kreis seiner Fami- 
lie, im Kongress und auf Reisen gezeigt. Seine biografische Vorgeschichte 
bleibt ausgeblendet.’ 

Auf insgesamt 236 wahrgenommene Geräusche entfallen 25 Türge- 
räusche, etwas mehr als 10%. Entsprechend dem distinguierten Setting 
sind die Türen mehrheitlich dezent angelegt. Auffällig sind häufige Wie- 
derholungen gleicher Geräusche. 


c) Türen in THE SILENCE OF THE LAMBs (USA 1992, Jonathan Demme) 
e Autotür (4), Autotür leise angedeutet, Autotür leise klappernd öff- 
nen, Autotür zuschlagen (2), Autotüren aufreißen 
e Lifttür (2), Lifttür klingelnd, Lifttür klappernd, Lifttür ratternd (2), 
Lifttür schließt 
° Metallgittertor klappernd, Metallgittertor leise hoch klappernd 


8 Der ideologische Hintergrund scheint sich direkt in der klanglichen Gestaltung der 
Umwelt niederzuschlagen, wenn man die dezent fließende Klanglichkeit von Wilson 
mit der rostig-schrillen Atmosphäre im Antikriegsfilm TweLve O’CLock HıcH (USA 
1949) vergleicht, bei dem ebenfalls Henry King Regie geführt hat. 
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Metalltür (2), Metalltür aufreifsen, Metalltür automatisch sirrend mit 

dumpfem Knall groß, Metalltür hoch quietschend und dumpf zu- 

schnappend (3), Metalltür klappernd (1), Metalltür quietschend (1), 

Metalltür rasselnd zuschnappen, Metalltür sehr hoch quietschend, 

Metalltür auf- und zuschließen, Metalltür automatisch sirrend mit 

dumpfem Knall groß, Metalltür zu automatisch dumpf verhallt 

Schiebetür leise, Schiebetür rasselnd abrupt 

e Tür quietschend (6), Tür quietschend mit leisem Klappern, Tür 
quietschend hoch, Tür groß quietschend, Tür hoch quietschend und 
klappernd, Tür quietschend hoch, Tür quietschend sehr hoch, Türen 
quietschend hoch dünn 

e Tür angedeutet (2), Tür angedeutet (whoosh) 

e Tür aufbrechen, Tür aufreißen (2), Tür aufreißen klappernd, Tür 
klappernd (2) 

e Tür leise schleifend 

e Tür metallisch klappernd 

Tür zuklappen 

e Tür zuschlagen klappernd 

Tür zuschnappen 


THE SILENCE OF THE LAMBS ist ein Psychothriller, in dessen Mittelpunkt die 
Entwicklungsgeschichte der jungen FBI-Psychologin Clarice Starling, ihre 
Auseinandersetzung mit dem gebildeten, aber hochgradig psychopathi- 
schen Serienmörder Dr. Hannibal Lecter sowie ihre Ermittlungsarbeit im 
Fall eines transsexuellen Massenmörders stehen. 

Die Tonspur, die in dieser Arbeit wiederholt besprochen wird, ist ein 
Paradebeispiel für ein hochkomplexes, durchstrukturiertes Sound Design, 
das Skip Lievsay kreiert hat. Bestückt mit emotional geladenen, suggesti- 
ven Elementen, schafft sie eine beklemmende Atmosphäre bedrohlicher 
Unsicherheit und trägt wesentlich zum Kultstatus dieses Films bei. 

Von total 521 beschriebenen Geräuschen entfallen 62 auf Türge- 
räusche, prozentual wenig mehr als in Wırson. Sie lassen sich grob in 
fünf Gruppen von Türtypen einteilen: Autotüren, Lifttüren, Metalltüren, 
quietschende Türen und allgemeine, nicht weiter spezifizierte Türen. Die 
unvermeidliche Metalltür charakterisiert - ähnlich wie in THE Bic House — 
ein gefängnisähnliches Setting: den verliesartigen Hochsicherheitstrakt 
einer psychiatrischen Anstalt, in der Dr. Lecter einsitzt. Außerdem — und 
hier wird es spannend - charakterisiert eine Metalltür auch das verlassene 
Lagerhaus, in dem Dr. Lecter seine Habseligkeiten aufbewahrt und das 
Clarice nachts bei Donner und Regen allein durchsucht, wobei sie auf den 
halbverwesten Kopf einer Leiche stößt (> Modellanalyse 429). 


Identifikation einer Quelle 117 


Uber diese klanglich-materielle Verwandtschaft, die durch andere 
Objekte mit ahnlicher Klanglichkeit unterstiitzt wird, installiert Lievsay 
auf einer übergeordneten narrativen Ebene eine Brücke, die sich dem Rezi- 
pienten sinnlich nachvollziehbar erschließt. Der Täter und die Spurender 
Tat werden miteinander verknüpft. 

Das ist kein Zufall. Ein ähnliches Verfahren, dessen Mechanismus 
unter dem Stichwort Leitmotiv näher untersucht wird (> 183), lässt sich 
beidem Typus der quietschenden Tür beobachten. Die quietschende Tür 
erklingt immer dort, wo Buffalo Bill, der transsexuelle Serienmörder, im 
Spiel ist: im Haus seines ersten Opfers, bei der Beerdigung und Obduk- 
tion des letzten Opfers, im naturhistorischen Museum, wo Clarice den 
Kokon untersuchen lässt, den sie im Rachen des Opfers gefunden hat, und 
zuletzt — wie erwartet - in Bills Zuhause. 

Wie die Metalltür ist auch die quietschende Tür ein genretypisches 
Element des Thrillers und des Horrorfilms, das ausschließlich dort ver- 
wendet wird, wo Unbehagen ausgedrückt werden soll. Statt dezent im 
Hintergrund wie die Türen in Wırson klingt sie eindringlich, hässlich und 
störend. Im heroisch-patriotischen Kontext von WILSON würde sie alar- 
mierend fremdartig wirken. 

Im Gegensatz zu WILSON finden sich kaum Wiederholungen. Die meis- 
ten Klangobjekte sind Unikate, die sich durch eigene, klar beschreibbare 
Merkmale von den anderen unterscheiden. Sie bezeichnen somit nicht eine 
Türe, sondern ein fein definiertes Exemplar, zum Beispiel die Metalltür auto- 
matisch sirrend mit dumpfem Knall groß. Verschiedene fakultative Merkmale 
spezifizieren das Klangobjekt, das sich damit semantisch vom Typ wegbe- 
wegt hin zum klar umrissenen Exemplar mit einer eigenen Individualität. 

Diese Eigenschaft kann unter verschiedenen Aspekten betrachtet 
werden. Sie resultiert aus einer deutlich gesteigerten Auflösung des Auf- 
nahme- und Wiedergabeapparats und äußert sich in der komplexen Struk- 
tur. Solche Klangobjekte lassen sich nicht einfach auf eine Quelle redu- 
zieren, sondern vereinigen in sich Bündel von distinkten Merkmalen. Im 
Gegensatz zu den stilisierten, vereinfachten Klangobjekten in WILSON sind 
sie mit klanglichem Überfluss ausgestattet. Sie sind somit schon auf einer 
primären Ebene nicht einfach nur indexikalische Zeichen, die auf eine 
Quelle verweisen, sondern mehrgliedrige Bündel von Zeichen, die sich 
auf den Ort, das emotionale Klima, die materielle Ausgestaltung und die 
prozesshafte Dynamik des Geschehens beziehen. 

Die hohe Auflösung in Verbindung mit der exakten, individuellen Aus- 
differenzierung der Merkmale erhöht den Eindruck des verbürgt Realen, den 
sogenannten Authentie-Effekt. Jedes Exemplar erzeugt ein gewisses Maß an 
Überraschung, an Unvorhersehbarkeit, an Offenheit, wie sie in der chaoti- 
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schen Zufalligkeit der natürlichen Lautsphäre üblich ist. Ganz im Gegensatz 
zum stilisierten, vereinfachten Klangobjekt, das sich durch die Wiederholung 
der immer gleichen Form dem kommunikativen Zweck unterordnet. 

Alle Merkmale sind darüber hinaus auditiv zu identifizieren und 
brauchen weder durch den weiteren narrativen Kontext noch durch die 
visuelle Darstellung fokussiert zu werden. Das Klangobjekt ist somit sou- 
verän. Es steht da als eigenständiges Konzept, das unabhängig von der 
visuellen Repräsentation wirksam werden kann. 

Eine andere Beobachtung ist für die weitere Diskussion interessant. 
Ähnlich klingende Klangobjekte sind sozusagen in Serie geschaltet. Die- 
ser Befund betrifft wiederum die Metalltür in der psychiatrischen Klinik 
(THE SILENCE OF THE LAMBS: 0.08.52-0.18.36). In dieser Szene - sie ist in 
vieler Hinsicht eine Schlüsselszene des Films — besucht Clarice Starling 
im Auftrag des FBI das erste Mal Hannibal Lecter in der Psychiatrie, um 
über ihn möglicherweise auf die Spur von Buffalo Bill zu kommen. Nach- 
dem sie vom Leiter der Psychiatrie ausführlich über die Gefährlichkeit von 
Dr. Lecter informiert wurde, steigt sie über diverse Treppen in das Verlies 
hinunter, wobei sich eine schwere Metalltür nach der anderen öffnet und 
wieder schließt. Die symbolischen Implikationen dieses Settings sollen an 
dieser Stelle vorderhand ausgeblendet bleiben. Interessant daran ist, dass 
sich diese Metalltüren akustisch zunächst gleichen, beschrieben als Metall- 
tür hoch quietschend und dumpf zuschnappend, das dreimal hintereinander 
zu hören ist. Danach beginnt eine Steigerung, die in Metalltür automatisch 
sirrend mit dumpfem Knall groß und Metalltüre zu automatischdumpfverhallt 
gipfelt. Diese klangliche Schiene wird während des Dialogs zwischen Lec- 
ter und Clarice aufgenommen vom klanglich und morphologisch sehr 
ähnlichen Geräusch, das ich als Schleuse hineinschieben metallisch rasselnd 
beschreibe. Es wird in dieser Anordnung ein musikalisch anmutendes 
Kompositionsprinzip mit Thema und Variationen ausgeführt. Von signifi- 
kanter Bedeutung ist die Tatsache, dass nicht nur eine Wiederholung glei- 
cher Klangobjekte erfolgt, sondern dass mit den Merkmalen gespielt wird 
und sie zueinander in Beziehung treten (Isotopie > 289). 


Die Stilisierung des Klangobjekts in der 
Hollywood-Klassik 


Die Beobachtungen zur Klangästhetik am Beispiel WıLson sind symp- 
tomatisch für die Tendenz zur Stilisierung im klassischen Hollywood- 
film. Vielleicht klingt die Behauptung provokant, dass die tonästheti- 
sche Kreativität des amerikanischen Mainstreamfilms zwischen 1933 
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und 1965 in den Standards erstickt sei. Nach der detaillierten Analyse 
von rund 50 Filmen und der Visionierung von ein paar Dutzend wei- 
teren Werken aus dieser Periode drängt sich aber der Schluss auf, dass 
diese Position nicht weit von den Tatsachen entfernt ist. Das Urteil wird 
jedoch wieder relativiert, wenn man die Idee akzeptiert, dass es ver- 
schiedene Konzeptionen von Kreativität und Tonästhetik gibt, die his- 
torisch und kulturell determiniert sind. Das klassische Hollywood ver- 
folgte andere Ziele als die nachfolgende Generation des New Hollywood. 
Die Ziele des Studiosystems waren in erster Linie ökonomisch moti- 
viert. Es ging um die Perfektion eines Produkts, das sich an die Massen 
wandte. 

Sind Regelwerke der Massenproduktion zu Beginn noch Gegenstand 
einer öffentlichen Diskussion und damit der bewussten Beeinflussung — 
wie beispielsweise in der Pionierzeit des Tonfilms -, verselbstständigen 
sie sich im Lauf der Zeit und reiben sich wie Kieselsteine in der fortdau- 
ernden Wiederholung ab, bis sie von der Praxis vollständig neutralisiert 
sind. Dieser Prozess der Konventionalisierung ist im Spannungsfeld zwi- 

schen maximaler Ordnung und maximalem Chaos angesiedelt. Massen- 
kulturelle Systeme bevorzugen gemäßigte Erneuerungen. Zwar reagieren 
sie auf das Bedürfnis des Konsumenten nach Differenzierung und Über- 
raschung, aber immer in einem genau kalkulierten, risikolosen Maß. Der 
Genuss von Populärkultur — dieses Phänomen wird im Kapitel Stereotype 
(> 176) ausführlich thematisiert — besteht unter anderem im Wiedererken- 
nen des Bekannten, in der rituellen Freude an der immer neuen Variation 
des Vertrauten. Der Terror des Unverständlichen muss sorgfältig vermie- 
den werden. Regeln und Konventionen haben die Funktion, Automatis- 
men in der Rezeption zu verankern, welche die Kommunikation erleich- 
tern und die potenzielle Mehrdeutigkeit des kulturellen Strukturangebots 
reduzieren. 

Ben Burtt, der Sound Designer von STAR Wars (USA 1977, George 
Lucas) und ein ausgezeichneter Kenner der Studio-Ästhetik meint 
dazu: 


[...] zwischen 1930 und 1965 [...] ist es sehr einfach, den Stil der einzel- 
nen Studios zu erkennen. Wenn ich einen Film sehe und einige Momente 
hinhöre, kann ich Ihnen sagen, ob er von Fox, von Paramount oder von 
Warner Brothers stammt. [...] Man kann das vor allem an den Geräu- 
schen erkennen, weil jedes Studio ein Geräuscharchiv hatte und Effekte 
wie Schüsse, Faustschläge, Donnergrollen oder Pferdewiehern in jedem 
Film wieder auftauchten. Jedes Studio hatte sehr unterschiedliche Ge- 
räusche. 
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Weil ich schon als Kind den Filmen zuhörte, bin ich mit dem Tonstil jedes 
Studios vertraut geworden.” (Ben Burtt in LoBrutto 1994: 139) 


Gleich zwei wesentliche Funktionen der Standardisierung scheinen in 
diesem Zitat auf. Zum einen die Festschreibung ins kulturelle Gedächtnis 
durch die Wiederholung gleicher oder ähnlicher Formen, zum anderen 
ihre Wirkung auf den Sozialisationsprozess in einer bestimmten Kultur, 
welche die Erwartungshaltung und den Anspruch an die Repräsentation 
der Wirklichkeit bestimmen. 

Die intertextuelle Wiederholung, die den einzelnen Traditionen der 
Stilbildung zugrunde lag, hatte auch arbeitsorganisatorische Gründe. Die 
Filme wurden in der kontrollierten Umgebung der Studios gedreht. Ori- 
ginalaufnahme bedeutete unter diesen Bedingungen Dialogaufnahme. 
Diese Praxis führte dazu, dass man die Tonspur in der Postproduktion von 
Grund auf konstruieren musste. Die nicht verbalen Elemente dieser Kons- 
truktion stammten größtenteils aus den Archiven. Das Geräuscharchiv 
war die Brutstätte der zugespitzten Stilisierung, die so typisch für diese 
Periode der Filmproduktion ist. Das Prinzip des ästhetischen Recyclings, 
das auch in anderen Bereichen der Filmproduktion so weit ging, dass die 
Drehbuchabteilung bei Warners Hallraum (echo chamber) hieß (Thomp- 
son/Bordwell 1994: 236), hatte eine zeichenhafte Verdichtung der einzel- 
nen Klangelemente zur Folge. Erfolgreiche Klangobjekte entwickelten sich 
durch ständige Wiederholung zu Prototypen: der Schuss aus SHANE (USA 
1953, George Stevens), John Waynes Faustschlag, der Wind aus YELLOW 
Sky (USA 1948, William Wellman). 

Die Stilisierung, kombiniert mit der von Chion beschriebenen Sand- 
wich-Position zwischen Musik und Sprache, trägt dazu bei, die wilde 
Seite des Geräuschs zu neutralisieren. Diese ideologische Komponente der 
Standardisierung im Hollywood-Kino wird von verschiedenen Autoren 
diskutiert. 

«Die damit verbundene Stabilisierung von Einstellungen und auch 
Ideologien mag ein wichtiger Grund dafür sein, dass soziale Systeme 
unterschiedlicher Art diesen Mechanismus immer wieder zum Zwecke 
der eigenen Affirmation nutzen» (Wuss 1993: 180). Wuss ist der Ansicht, 
dass dieStandardisierung grundsätzlich mit dem Industrialisierungspro- 


9  «[...] from 1930 to 1965 [...] it’s very easy to distinguish the style of each studio. Just 
in watching a show and listening for a few moments, I can tell you whether it was Fox 
or Paramount or Warner Brothers. [...] You can particularly tell by the sound effects, 
because each studio had a library and sounds like gunshots, face punches, thunder- 
claps, and horse whinnies that would reoccur in film after film. Each of the studios had 
very distinctive sounds. From listening to films as a child, Ihad become very familiar 
with the sound styles of the studios.» 
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zess zusammenhänge und eine Konsequenz der Herstellungstechnolo- 
gie sei. 

Doane kritisiert die manipulative Täuschung, die ihrer Meinung nach 
an dieses technische System und die herrschende Praxis gekoppelt ist: 


Alle diese Techniken entspringendem Bestreben, den Filmton von seiner 
Quelle zu trennen, die filmische Arbeit zu verdecken. Sie vermitteln den Ein- 
druck, die Wirklichkeit lasse sich mühelos und mit Leichtigkeit reproduzie- 
ren. Was unterschlagen wird, ist der äußerst spezialisierte und fragmentierte 
Prozess, der dies überhaupt ermöglicht, und das Ausmaß und die Kosten 
des Geräteparks, den man braucht, um eine Tonspur zu produzieren, die den 
Standards der Filmindustrie genügt." (Doane 1980b: 58) 


Dieser Einwand verfehlt in gewisser Weise das Ziel, weil die Maskie- 
rung des Produktionsprozesses ein Bestandteil vieler massenkultureller 
Erscheinungen und kein spezifisches Moment der Tonkreation im Holly- 
woodfilm ist. Hingegen ist das Klangobjekt als solches — in welchem Pro- 
duktionsprozess auch immer - speziell geeignet, die Spuren seiner Entste- 
hung mimetisch zu kaschieren. Diese Eigenschaft hängt aber weniger mit 
der Produktionsweise zusammen. Sie ist vielmehr mit den Eigenschaften 
der auditiven Wahrnehmung verbunden, welche die Phänomene synkre- 
tistisch verschmilzt, und mit der fehlenden analytischen Erziehung im 
Bereich des Hörens in unserer Kultur. 


Das souveräne Klangobjekt des 
zeitgenössischen Films 


Vom traditionellen Hollywoodfilm unterscheiden sich die Tonspuren seit 
Mitte der 1970er-Jahre in auffälliger Weise durch ein komplexes akusti- 
sches Arrangement. Sie befreien das Geräusch aus dem Korsett der allzu 
rigiden Stilisierung und geben ihm seine Wildheit zurück. Die Wildheit 
wird potenziert durch eine bisweilen chaotisch wirkende Überlagerung 
mehrerer Schichten, die sich ergänzen und miteinander konkurrieren bis 
hin zur völligen Maskierung einer Schicht durch die andere. Darin mani- 
festiert sich ein neuer Zugang zur fiktionalen Konstruktion, der sich stär- 


10 «All of these techniques are motivated by a desire to sever the film from its source, to 
hide the work of the production. They promote a sense of the effortlessness and ease 
of capturing the natural. What is concealed is the highly specialized and fragmented 
process, the bulk and expense of the machinery essential to the production of asound 
track, which meets industry standards.» 


122 Semantik erster Ordnung 


ker an der außerfilmischen Wirklichkeit als an der eigenen Tradition aus- 
richtet. Mit minutidsen Schwankungen des klanglichen Details wird eine 
komplexe Form natürlicher Klangerzeugung nachgebildet mit dem Ziel, 
eine höhere Form des Authentie-Effekts zu erzielen. 

Wie ich im Kapitel Musikalisierung der Tonspur (> 264) genauer dar- 
stellen werde, gibt es seit Beginn dieses Jahrhunderts eine wiederkeh- 
rende, mysteriöse Koinzidenz zwischen der Integration geräuschhafter 
Klangkomponenten in die musikalische Komposition und verschie- 
denen antibürgerlichenoder avantgardistischen Bewegungen. Merk- 
würdigerweise ist auch im Hörspiel seit Beginn der 1960er-Jahre eine 
Rückkehr des Geräuschs zu verzeichnen. Auch dort war es — wie im 
Spielfilm - seit den ersten, experimentell und avantgardistisch ausgeleg- 
ten, Versuchen Anfang der 1930er-Jahre von einer zunehmenden Kon- 
zentration auf wesentliche kommunikative Elemente zurückgedrängt 
worden. 

Im Kontext des New Hollywood ist einerseits an den Einfluss der 
Rockmusik sowie verschiedener Strömungen in den späten 1950er- und 
den 1960er-Jahren, namentlich der französischen Nouvelle vague zu den- 
ken. Die Nouvelle vague praktizierte andere Produktionsverfahren als der 
klassische Mainstreamfilm: Drehen an Originalschauplätzen, minimierter 
Postproduktionsaufwand, Einfangen der natürlichen Alltagswelt in ihrer 
chaotischen Komplexität ohne manipulative Eingriffe und ohne dramatur- 
gisch motivierte Höhepunktstruktur. 

Die technischen Voraussetzungen für diese Ästhetik standen schon 
seit den 1950er-Jahren bereit. 1951 hatte Stefan Kudelski, ein in die 
Schweiz emigrierter Pole und Student an der EPF in Lausanne, den Proto- 
typ der Nagra entwickelt. Die Nagra ist eine kleine portable Bandmaschine, 
bestückt mit Mikrofonvorverstärkern. Sie wird von Batterien gespeist, 
ist also netzunabhängig. Wegen ihrer ausgezeichneten technischen und 
klanglichen Qualität und ihrer unverwüstlichen Bauart hat sie während 
Jahrzehnten weltweit den Markt beherrscht. Die hervorragenden Klang- 
eigenschaften des Magnettons standen damit auch für das Drehen an Ori- 
ginalschauplätzen zur Verfügung, das seit den späten 1960er-Jahren auch 
in Hollywood mehr und mehr üblich wurde. 

Mit dem neuen portablen Equipment konnte man den Außenton 
als ästhetisches Element in allen Variationen einfangen und montieren. 
Die französische Nouvelle vague hatte sich von der klassischen Holly- 
wood-Ästhetik radikal verabschiedet und versuchte auf ihren Tonspuren 
die Klangsphären so wiederzugeben, wie sie nun einmal waren. Brüche 
in der Kontinuität, chaotische Überlagerungen lösten das Prinzip der 
Sprachverständlichkeit auf und entlarvten die Künstlichkeit des klini- 
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schen Hollywood-Tons. Die natürliche Lautsphäre, welche diese Tonspu- 
ren abbildeten, beschränkte sich nicht auf den Bildausschnitt, sondern 
umfasste alle Elemente des 360°-Klangraums. Ihre Schönheit besteht nicht 
in der Stilisierung, sondern im Variantenreichtum. Es ist eine Schönheit 
des Zufalls. 

Der Effekt eines unstrukturierten Geräuschteppichs entsprang in der 
französischen Nouvelle vague jedoch in erster Linie einem veränderten Pro- 
duktionsprozess und weniger dem technischen Prinzip. Nicht die Wahl 
des Mikrofons — Kugelcharakteristik hatten auch die Mikrofone des frü- 
hen Tonfilms -, sondern die Wahl realer Drehorte außerhalb der Studios, 
die Verpflichtung kaum ausgebildeter Techniker im Rahmen der Cinema 
copain-Philosophie und das Drehen mit Kleinstteams brachten eine solche 
Ästhetik hervor. Der technische Standard wurde unter dem Diktat eines 
hochtrabenden ideologischen Überbaus funktionalisiert, wie er die Debat- 
ten der 1960er-Jahre im Umfeld der außerparlamentarischen Oppositions- 
bewegungen prägte. Nicht die technische Innovation, sondern die Idee 
stand im Vordergrund der Entwicklung der Nouvelle vague und führte im 
Lauf der Zeit zu einer reichhaltigen und in jeder Hinsicht hochstehenden 
Tonkultur des französischen Films. 

Ohne diesen Stachel wären einige der spannendsten Tonspuren des 
New Hollywood kaum denkbar. Diese Vermutung stützt eine Aussage 
von Richard Beggs (1997), Coppolas langjährigem Sound Designer: «Die 
Generation von Francis [Coppola] und George [Lucas] erhob Godard wäh- 
rend langer Zeit zum Idol. Die europäische Bereitschaft, sich auf Unkon- 
ventionelles einzulassen, sprach die meisten von ihnen an.»" 

Im Gegensatz zu ihren französischen Vorläufern waren die amerika- 
nischen Tonkreationen jedoch nicht Nebenprodukt eines Konzepts, son- 
dern genau kalkulierte Effekte, welche die Fiktionalität nicht überwanden, 
auch nicht zu überwinden vorgaben, sondern nur noch virtuoser kaschier- 
ten. Es ging dabei nicht um die Repräsentation der ureigenen Vielschich- 
tigkeit einer natürlichen Lautsphäre. Vielmehr wurden sämtliche Details 
der komplexen Klangwelt analysiert, in die einzelnen Bestandteile zerlegt 
und auf der Basis dieser Aneignung neu aufgebaut. Die traditionelle Pra- 
xis des Hollywoodfilms, die Tonspur mit Ausnahme brauchbarer Teile des 
Dialogs von Grund auf in der Postproduktion zu kreieren, wurde nicht 
angetastet. Nicht der Zufall kurbelte die Vorstellungskraft an, sondern die 
genaueste Kontrolle auch des scheinbar unwichtigsten Elements wie Wal- 


11 «Francis’s [Coppola] and George’s [Lucas] generation sort of idolized Godard for a 
long time. The European willingness to embrace the unconventional appealed to most 
of those people.» 
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ter Murch, der Sound Designer von APocALYPSE Now (USA 1979, Francis 
Ford Coppola), dokumentiert: 


Der Helikopterangriff ist eine Mischung von vier verschiedenen Dialog- 
schichten: ein bisschen Originalton, hauptsächlich Duvalls Stimme, dann 
das Schwatzen der Piloten, die Kinder, die unten am Boden laufen, und 
zusätzlich noch «richtiger» ADR-Dialog. Auch dort habe ich den Dialog 
weit stärker als üblich gefiltert, sodass die Leute, selbst wenn sie schreien, 
dünn und blechern klingen. Das entspricht dem, was wir normalerweise 
in Dokumentarfilmen hören, in denen der ganze rumpelnde Bassbereich 
herausgefiltert wird. Außerdem habe ich den Regler stärker auf und ab ge- 
fahren; wenn sich nun jemand von der Kamera abgewendet hat, habe ich die 
Lautstärke zurückgedreht, um den Eindruck zu erwecken, dass die Leute 
sofort aus dem Mikrofonbereich verschwinden, wenn sie sich bewegen, weil 
die konkurrierenden Geräusche so laut sind. Wir wollten vor allem einen 
Eindruck von Realität erzeugen, denn wir befürchteten, dass der Film sonst 
nachsynchronisiert klingen würde.'? (Murch in LoBrutto 1994: 95) 


Es ging also um die minutiöse Rekonstruktion des authentisch wirken- 
den, unreinen Tons. Die extreme Künstlichkeit, die dabei entsteht, ist in 
sich selbst jedoch wieder so kohärent, dass sie ohne Weiteres als natürlich 
akzeptiert wird, wie die Diskussion mit Rezipienten immer wieder zeigt. 
Selbst ausgesprochene Filmfreaks nehmen an, dass die Klangobjekte ihre 
Quelle in der profilmischen Wirklichkeit haben. 


Eine solche mimetische Simulation des komplexen Klangobjekts 


suchten George Lucas und Sound Designer Ben Burtt selbst für die abge- 
hobensten virtuellen Objekte in STAR WARS: 


12 


Beim ersten Gespräch mit George (Lucas) sagte er — und ich war gleicher 
Meinung -, er wolle eine «organische» Tonspur, im Gegensatz zu einer elek- 
tronischen oder künstlichen. Da wir eine sichtbare Welt konstruieren wollten, 
die rostig war und verbeult und verdreckt, brauchten wir eine Tonwelt, die 
quietschte, und Motoren, die laut und unregelmäßig liefen. 


«So the helicopter attack sequence is a sandwich of four different sounds of dialogue. 
There is some production dialogue, Duvall mostly. There is this pilot chatter. There 
are the kids on the ground running, and there is «real» ADR dialogue. Even there, I 
filtered the dialogue much more than you would normally do. So people are shout- 
ing, but they sound tinny. It’s what we are used to when we’re hearing real documen- 
tary sound where all the rumbly low end is filtered out. Also, I was riding the pot a lot 
more, so that when anyone turned from the camera, I would duck the sound to give the 
impression that as soon as they moved a little bit, they went right off-mike because the 
competing sounds were so loud. What we wanted most was a sense of reality. We were 
afraid it would sound like a dubbed film.» 
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Daher wollten wir unser klangliches Rohmaterial aus der Wirklichkeit be- 
ziehen: echte Motoren, Türen, die tatsächlich quietschten, authentische Tier- 
laute, echte Insekten usw.'? (Burtt in Blake 1983: 35) 


Bereits für den Science-Fiction-Film THX 1138 (USA 1970/71, George 
Lucas) hatten Lucas und Murch (in LoBrutto 1994: 85) das Konzept der 
used future entwickelt, worunter sie den Einbezug natürlicher Geräu- 
sche in die Konstruktion der virtuellen Welt und den Verzicht auf das 
traditionell elektronische Vokabular früherer Science-Fiction-Filme ver- 
standen. Zwar ging es um eine Abgrenzung gegenüber der Tradition, 
allerdings in genauester Kenntnis der Filmgeschichte. Es ging um den 
Aufbau eines neuen Vokabulars, das sich von der gewohnten Stilisierung 
unterscheiden sollte. Konserven aus dem Geräuscharchiv mit ihrem die 
Authentizität störenden Wiedererkennungswert wurden nur ausnahms- 
weise verwendet. Man erkannte den emotionalen Ausdruck des Rohen, 
Realen, das an die Alltagserfahrung anknüpft. Man suchte die Erlebnis- 
qualität des Tons, der nicht nur als untergeordnetes Element die Erzäh- 
lung unterstützt, sondern einen eigenständigen Mehrwert zur Verfü- 
gung stellt. 

Murch und Burtt, die beide in besonderer Weise an diesem stilisti- 
schen Umschwung beteiligt waren, sehen eine wichtige Basis der neuen 
Ästhetik in der Veränderung des Arbeitsprozesses.'* Die neue gestalteri- 
sche Freiheit, kombiniert mit neuen flexiblen und hochwertigen Techno- 
logien, ermöglichte die zeitintensive Arbeit am klanglichen Detail, das für 
das souveräne Klangobjekt des New-Hollywood-Films charakteristisch 
ist. Es zeichnet sich durch einen sensorischen Überfluss aus, welcher der 


13 «In my first discussion with George [Lucas], he said — and I concurred with him - that 
we wanted an «organic», as opposed to electronic and artificial, soundtrack. Since we 
were going to design a visual world that had rust and dents and dirt, we wanted a 
sound world that had squeaks and motors that may not be smooth sounding or quiet. 
Therefore we wanted to draw upon raw material from the real world: real motors, real 
squeaky doors, real animal sounds, real insects; this sort of thing.» 

14 Murch (in LoBrutto 1994: 85): «In Bezug auf technische Errungenschaften geht fast 

immer die Vorstellung, was man in künstlerischer Hinsicht erreichen will, der Erfin- 
dung eines passenden Werkzeugs manchmal sogar um Jahre voraus. Man kann «fort- 
schrittliche» Effekte herstellen, wenn man sich die Zeit dafür nehmen kann und sie 
wenn notwendig «von Hand» einzeln produziert. Die technologische Entwicklung 
vereinfacht Prozesse lediglich, die bereits auf arbeitsintensive Weise möglich waren, 
und macht sie damit angenehmer.» 
(«Regarding technological advances, almost always the concept of what you want to 
achieve artistically precedes, sometimes by years, the invention of a device that does 
it efficiently. You can create effects that are «advanced» if you take the time to produce 
them, «by hand» if necessary. The development of technology usually just makes more 
convenient and automatic something that was already being achieved in a labor-inten- 
sive way.») 
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rein kommunikativen Hinweisfunktion überlagert ist. Kleinste klangliche 
Schwankungen simulieren die Schönheit des Zufalls, die in der belebten 
Natur zu finden ist. 


Das unidentifizierbare Klangobjekt 


Wir nennen es im Folgenden UKO, das unidentifizierbare Klangobjekt. Seine 
Entdeckung geht auf die exakte Analyse des Korpus und ihre Auswertung 
zurück. Deren Resultate stehen in schroffem Gegensatz zur allgemeinen 
Annahme, dass der Mainstreamfilm und insbesondere seine Tonspur alle 
Elemente ausblende, die nicht unmittelbar zum Bedeutungsaufbau beitra- 
gen (u.a. Altman 1992, Gorbman 1980, Winkler 1992). Sie widersprechen 
auch der Auffassung, dass der Verweis auf eine Quelle eine der wichtigs- 
ten Funktionen des Geräuschs sei, eine Auffassung, deren namhafteste 
Vertreter Kracauer und Baläzs waren. Vielmehr ist die unterbrochene Ver- 
bindung zur Quelle ein Hauptcharakteristikum des UKO. Eine Quelle ist 
weder im Bild sichtbar, noch wird sie aus dem Kontext erkenntlich. Außer- 
dem wird dem Rezipienten auch die Hilfestellung des Wiedererkennens 
verweigert, sodass es im Allgemeinen nicht zu einer Reduktion der Mehr- 
deutigkeit kommt. Vielmehr scheint die Erhaltung dieser Mehrdeutigkeit 
ein unausgesprochenes Ziel der bewussten Platzierung von UKOs zu sein. 

Der brasilianische Regisseur Alberto Cavalcanti hatte bereits 1939 in 
einem Aufsatz für den Einsatz von UKOs zur Spannungserzeugung plä- 
diert: «Haben Sie jemals nachts einen Ton gehört — nicht synchron -, d.h. 
ohne die geringste Ahnung, was ihn verursacht haben könnte? Und Ihr 
Bett verlassen, um nachzuschauen, wo dieser Knall oder Bums herkam?»"? 
Im Rahmen einer Produktion hatte er vorgeschlagen, einem Schiffsunter- 
gang ein schreckliches metallisches Kreischen zuzuordnen, das klang, als 
ob das Schiff diagonal auseinanderbersten und dabei einen schrecklichen 
Schrei ausstoßen würde. Diese Idee ging auf ein Erlebnis in einem Stumm- 
film zurück: 


Ein Flugzeug flog auf uns zu. Der Dirigent unterbrach das Orchester abrupt, 
und ein fremdartiges, erschreckendes Geräusch setzte ein und wurde lauter 
und lauter. Es klang nicht wie ein Flugzeug, sondern sehr Furcht erregend 
[...]. Es war ein Geräusch, das mir schon ein Leben lang bekannt war - ein 
offenes Becken, das mit zwei weichen Trommelschlegeln angeschlagen wur- 


15 «Have you ever heard a noise in the night - nonsync - i.e., without having any notion 
of what caused it? Of course. And you left your bed and went down to find out what 
caused the bang, or the thump.» 
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de [...]. Es hatte seine Identität verloren und nur sein dramatisches Potenzial 
behalten, das sich nun in Zusammenhang mit dem Bild entfaltete.'‘ 
(Cavalcanti 1939: 37) 


Er machte grundsätzliche Unterschiede zwischen Sehen und Hören für 
den suggestiven, emotionalen Charakter des unidentifizierbaren Klang- 
objekts verantwortlich, das an angeborene Reflexe appelliert, die schon 
beim Säugling zu beobachten sind. 

Cavalcantis Idee war ihrer Zeit weit voraus. Im klassischen Holly- 
woodfilm bis Ende der 1950er-Jahre ist die Verwendung unidentifizier- 
barer Klangobjekte äußerst selten, wie ein Blick auf das Diagramm ent- 
hüllt (> Anhang Diagramme 453). Nur zwei Produktionen machen in 
dieser Periode namhaften Gebrauch davon: MODERN TIMEs von Charlie 
Chaplin (USA 1936) und CITIZEN KANE von Orson Welles (USA 1941). 
Beide Produktionen verweigern sich den tiblichen Hollywood-Stan- 
dards. MODERN TIMES greift explizit auf die pantomimisch-gestische Aus- 
drucksweise des Stummfilms zurück, indem Chaplin ganz auf Sprache 
verzichtet und Geräusche nur sehr sparsam und mehrheitlich abstrakt 
einsetzt. 

CITIZEN KANE war Orson Welles’ erste Filmarbeit. Welles’ berühmter 
Sinn für die Tonsprache ging auf seine Tätigkeit als Hörspielregisseur für 
den Rundfunk zurück, wo er große Erfolge feierte, unter anderem mit dem 
äußerst suggestiven Dokudrama WAR OF THE WORLDS. Es ist ausgespro- 
chen aufschlussreich, dass das UKO ausgerechnet in CITIZEN KANE einen 
solchen Stellenwert einnimmt. Rätsel und Mehrdeutigkeit sind Schlüssel- 
begriffe sowohl seiner narrativen Konstruktion als auch seines Gegen- 
stands. Das Rätsel um Kanes letztes Wort «Rosebud» fungiert als Motor 
der Handlung und Bindeglied der Erinnerungen verschiedener Personen; 
der Protagonist selbst, Kane, bleibt in seiner schillernden Mehrdeutigkeit 
bis zuletzt als Faszinosum erhalten. Die Beobachtung von Chion (1990: 
114), dass Welles’ Filme den Eindruck einer überbordenden Reichhaltig- 
keit hinterlassen, einer Reichhaltigkeit, die einer exakten Analyse nicht 
standhält, ist durchaus richtig. Die Quantität der Klangobjekte bewegt 
sich in CITIZEN KANE eher im unteren Durchschnitt. Chion macht den 
beschleunigten visuellen und sprachlichen Rhythmus für die Erinnerungs- 
trübung verantwortlich. Diese Interpretation trifft auf CITIZEN KANE nicht 


16 «An airplane was flying toward us. The music director «cut» the orchestra, and a 
strange, frightsome sound began, and got louder and louder. It was nothing like an air- 
plane, but very frightening. [...] It was a noise I had known all my life-an open cymbal 
beaten with two soft-headed drumsticks. [...] it had lost its identity and retained only 
its dramatic quality, used in conjunction with the picture.» 
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zu: Weder kann man dort eine besondere Geschwindigkeit noch einen aus- 
gepragten visuellen Rhythmus beobachten. Der Eindruck von akustischer 
Vielfalt geht viel eher auf die sorgfaltige Variation der Klangobjekte und 
die klangliche Differenzierung — auch des Dialogs — zurück, nicht zuletzt 
aber auf die Verwendung von UKOs, deren Klanglichkeit spezifisch durch 
das Fehlen einer visuellen Verankerung reichhaltig erscheint, indem sie 
die Fantasie des Zuschauers anspricht und so eine innere Anreicherung 
erzeugt. 

Im Umfeld des stilisierten Hollywoodfilms steht CITIZEN KANE auch 
heute noch wie ein verfrühter Fremdkörper da. Die Regel See a dog — hear a 
dog steht für die damals vorherrschende Auffassung, dass Geräusche nur 
verständlich sind, wenn sie vom entsprechenden Bild begleitet werden. In 
der Tat sind auf einem verrauschten Monolichtton aus den 1940er-Jahren 
Applaus und Regen kaum voneinander zu unterscheiden. Vagheit und 
Unbestimmbarkeit sind als Stilmittel aber nur möglich, wenn sie nicht 
als Fehler interpretiert werden. Eine technische Voraussetzung dafür ist 
also eine feine Auflösung mit genauer klanglicher Definition. Solange ein 
Klangobjekt generell als unidentifizierbar gilt, wenn seine Quelle nicht 
durch das entsprechende Bild verdeutlicht wird, bleibt jedes unidenti- 
fizierbare Klangobjekt eine solche Störung. Eine unerwünschte Störung 
aber macht den technischen Apparat plötzlich sichtbar, entlarvt den Film 
als Artefakt, zerstört die Illusion. Mott als erfahrener Praktiker der alten 
Schule hat diese Konvention verinnerlicht: 


Unidentifizierte Geräusche, besonders wenn sie länger anhalten, ziehen die 
Aufmerksamkeit auf sich und beginnen sehr schnell zu stören. Geräusche 
sollten eine Szene unterstützen und untermalen, nicht die Aufmerksamkeit 
der Zuhörer abziehen und sie verwirren.” (Mott 1989: 160) 


Dies erklärt zumindest teilweise, warum unbestimmbare Toneffekte vor 
den 1970er-Jahren vermieden wurden. 

Mit der Verfeinerung der Auflösung hat sich die Ästhetik auch in 
dieser Hinsicht geändert. In zeitgenössischen Science-Fiction- und Action- 
filmen machen UKOs teilweise rund 20% aller wahrnehmbaren Ton- 
elemente aus. Zur Einführung von rätselhaften Wesen oder virtuellen 
Gegenständen greifen Regisseure seit den 1960er-Jahren vermehrt auf die 
Fantasie erzeugende Kraft des unbestimmbaren Lautobjekts zurück. Wie 
in der Modellanalyse der Expositionsszene aus JURASSIC PARK (USA 1993) 


17 «Unidentified sounds, especially if present over a long period of time, draw atten- 
tion to themselves and very quickly become bothersome. Sounds should support and 
emphasize a scene, not divert and confuse the listener’s attention.» 
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(> 414) exemplifiziert wird, ist Steven Spielberg ein Meister der suggesti- 
ven Anwendung von UKOs. Dort stellen wir uns irgendein Wesen vor, ein 
gewalttätiges auf jeden Fall, davon zeugen die Laute und die Materialisie- 
rung seines Käfigs. 

Das UKO kann man als offenes, unterdeterminiertes Zeichen verste- 
hen, dessen Vagheit verwundbare Offenheit und gleichzeitig neugierige 
Spannung erzeugt. Als Leerstelle im Text ist es wie eine Projektionsfläche 
für die individuelle, subjektive Bedeutungserzeugung des Zuschauers. 
Das nicht eindeutige Klangobjekt stellt eine Frage, und der Zuschauer 
wird versuchen, das Rätsel durch Interpretation zu lösen. 

Die Mehrdeutigkeit und das damit verbundene Informationsdefizit 
erzeugt umso stärkere Emotionen, je länger sie besteht. Wuss (1993: 321) 
geht davon aus, dass diese Unsicherheit eine emotionale Komponente 
hat, weil sie als Verlust der Kontrolle empfunden wird. So gesehen, ist das 
UKO ein Instrument zur gezielten Frustration des Rezipienten, das ein 
Gefühl von Ohnmacht und Angst erzeugt. Dieses Gefühl der Angst wird 
im Fall des UKO noch auf der Ebene des Instinkts verdoppelt. Gefahren 
in der Natur künden sich seit den Anfängen der Menschheit über Geräu- 
sche an. Es kann entscheidend sein, auf Geräusche, die Gefahren signali- 
sieren, schnell und adäquat zu reagieren. Am bedrohlichsten aber wirken 
jene Geräusche, die nicht innerhalb angemessener Zeit einer bekannten 
Quelle zugeordnet werden können. Dieser Befund wird gestützt von der 
Analyse des Korpus (> Anhang Diagramme 453): Science-Fiction-, Horror- 
und Katastrophenfilme verwenden die höchste Anzahl von UKOs. Steven 
Spielbergs Jaws (USA 1975), in mancher Hinsicht ein Vorreiter späterer 
Entwicklungen, kann als prototypisches Beispiel für die Verwendung von 
UKOs gelten. JAws ist die Fabel gewordene Verarbeitung einer irrationa- 
len, an Hysterie grenzenden Angst. Sein Erfolg gründet auf dem unmit- 
telbaren emotionalen Appell. Das Ohnmachtsgefühl des wasserscheuen, 
ängstlichen Chief Brody widerspiegelte direkt das Gefühl einer Mehrheit 
in den USA zur Zeit von Vietnam-Debakel und Erdölkrise. 

Das Auftreten des UKO in den 1960er-Jahren kann in einen weiteren 
sozialen und kulturellen Kontext gesetzt werden. Seine vage Mehrdeutig- 
keit, die mehrere Interpretationen zulässt, steht in deutlichem Gegensatz 
zur verengten Bedeutung des stilisierten Geräuschs der Hollywood-Klas- 
sik. Dieser Wandel hat nicht nur technische Gründe, sondern er geht auch 
von einem veränderten Bild des Zuschauers aus. Der Zuschauer wird als 
mündiger Partner angesehen, der über eine entwickelte Medienkompe- 
tenz verfügt und sehr wohl in der Lage ist, eigenständige Hypothesen 
zu bilden und auch ungewöhnliche Reizangebote zu verarbeiten und 
zu interpretieren. Damit steht das UKO in Opposition zu jenen stereo- 
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typisierten Zeichen, die — durch eine kulturelle Praxis codiert — nur eine 
einzige Interpretation zulassen und den Rezipienten zu passivem Kon- 
sum auffordern (> Stereotypen 176). Während die Redundanz des stili- 
sierten Klangobjekts, das außerdem seine Quelle im Bild hat und somit 
auf Informationsverdoppelung beruht, den Zuschauer in eine eindeutige, 
vom filmischen Text vorgegebene Perspektive zwingt, erfordert das UKO 
gedankliche Tätigkeit. Es steht damit in der Tradition des offenen Texts, 
wie mehrdeutige Bauformen in Anschluss an Umberto Ecos Opera aperta 
(1962) genannt werden. Das offene Werk, dessen Merkmal Konflikthaftig- 
keit und eine gewisse Irrationalität in der Anordnung des erzählerischen 
Materials ist, wirkt lebensechter als hermetische Erzählformen. 

Im UKO manifestiert sich deshalb ein Widerspruch. Eingebettet in 
die klassischen geschlossenen Erzählformen des Mainstreamfilms mit 
obligatem Happy End, repräsentierte sein Stück gattungsfremder Kunst. 
Das lustvolle Erleben der Angst und des zeitweisen Verlusts der Kontrolle 
wird gerade vom affirmativen Kontext gestützt, der den Rezipienten auf 
mehreren Ebenen immer wieder daran erinnert, dass er sich in einer kons- 
truierten Welt befindet, die sich von seiner lebensweltlichen Realität unter- 
scheidet. 

Losgelöst von der begrifflichen Bedeutung, offerierte sein Stück 
gedanklicher Freiheit, wie sie für lyrische oder abstrakte Kompositionen 
typisch ist. Befreit vom Zwang, etwas Bestimmtes zu bedeuten, ist es ein 
Stück reine Musik, die sich in der Offenheit für assoziative Verknüpfun- 
gen auf abstrakt klanglicher Ebene äußert, ein Aspekt, der unter den Stich- 
worten Musikalisierung der Tonspur (> 264) und Isotopie (> 289) in allen 
Facetten thematisiert werden soll. Außerdem symbolisiert das unidentifi- 
zierbare Klangobjekt in extremem Maß die Befreiung der Tonspur von der 
Knechtschaft des Bildes, die eines der Hauptthemen dieser Arbeit bildet. 
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In den vorhergehenden Kapiteln habe ich Aspekte der Bedeutungskonstitu- 
tion primär aus der Perspektive der auditiven Wahrnehmung betrachtet. Im 
Folgenden geht es darum, das filmische Klangobjekt an seinen Ursprungs- 
ort zurückzuverpflanzen und die spezifisch filmische Bedeutungskonstitu- 
tion als einen Austausch zwischen Bild und Ton zu interpretieren, Fragen 
nach den wechselseitigen Einflüssen zu stellen und die Bedingungen zu 
untersuchen, unter denen eine kohärente Beziehung zwischen den visuel- 
len und akustischen Darstellungsweisen überhaupt entstehen kann. 

Diese Fragestellungen gehören zu den bestuntersuchten Gegenstän- 
den der filmtheoretischen Auseinandersetzung mit der Tonspur. Bahn- 
brechend für die differenzierte Betrachtung der optisch-akustischen Inter- 
aktion ist Michel Chions L’Audio-vision (1990). Chion, der im Umfeld von 
Pierre Schaeffer und Pierre Henry auch als Komponist in der Tradition der 
Musique concrete tätig war, hatte schon in den 1980er-Jahren eine Reihe von 
Texten zur Tonspur veröffentlicht. In L’Audio-vision unterbreitet er jedoch 
ein wesentlich ausgereifteres terminologisches Gerüst, das mindestens 
teilweise als Reflex auf kritische Äußerungen zu den früheren Konzepten 
zu verstehen ist. 


Der Film, das Fernsehen und die audiovisuellen Medien im Allgemeinen 
wenden sich nicht nur ans Auge. Sie wecken im Zuschauer — dem «Audio- 
Zuschauer» — eine spezifische Wahrnehmungsweise, die ich in diesem Buch 
Audio-vision nennen werde. 

[...] 

Der Gegenstand dieses Buchs ist es zu zeigen, wie im audiovisuellen Zusam- 
menspiel eine Wahrnehmungsmodalitat die andere beeinflusst und verändert: 
Man «sieht» nicht mehr dasselbe, wenn man es gleichzeitig hört, und man 
«hört» nicht mehr dasselbe, wenn man es gleichzeitig sieht. (Chion 1990: 3) 


1 «Les films, la télévision et les media audio-visuels en général ne s'adressent pas seule- 
ment à l'œil. Ils suscitent chez leur spectateur - leur <audio-spectateur> — une attitude 
perceptive spécifique, que nous proposons, dans cet ouvrage, d’appeler l’audio-vi- 
sion. [...] L’objet de ce livre est de montrer comment en réalité, dans la combinaison 
audio-visuelle, une perception influence l'autre et la transforme: on ne <voit> pas la 
même chose quand on entend; on n’ <entend> pas la même chose quand on voit.» 
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Mit diesem Ansatz gelingt es Chion, die unfruchtbare Frage nach einer 
möglichen Dominanz des einen oder anderen Wahrnehmungssystems — 
des Sehens oder des Hörens — zu durchbrechen und einen konstruktiven 
Zugang zu etablieren, dem ich mich anschließen werde. 

Merkwürdigerweise geht Chions Vorgehen nur partiell auf die neu- 
eren tonästhetischen Entwicklungen zurück, als deren auffälliges Merk- 
mal die Emanzipation der Tonspur vom Bild gelten kann. Chion äußert 
sich eher am Rande und zum Teil sehr kritisch zu neueren Filmen. Insbe- 
sondere postuliert er, dass es keine Tonspur gebe: 


Wenn ich behaupte, dass es keine Tonspur gibt, so will ich damit vorerst sa- 
gen, dass die Töne eines Films — vom Bild losgelöst wahrgenommen - in sich 
keinen Komplex mit einer inneren Einheit bilden, welche der Bildspur als 
Ganzes gegenübergestellt werden könnte. Außerdem will ich damit sagen, 
dass jedes klangliche Element mit den narrativen Elementen — den Figuren, 
der Handlung - ebenso wie mit den visuellen Elementen Textur und Aus- 
stattung sehr viel direktere, stärkere und prägnantere Verbindungen eingeht 
als mit den anderen Tönen, die simultan oder vertikal dargeboten werden. 
Diese Verbindungen sind auch ausgeprägter als die horizontalen zwischen 
aufeinander folgenden Tönen. Es ist wie bei einem Rezept: Hätte man die 
klanglichen Elemente zusammengemischt, bevor man sie über das Bild ge- 
gossen hätte, würde eine chemische Reaktion eintreten, welche die Elemente 
destabilisieren und jedes individuell mit dem Bild reagieren ließe. 

(Chion 1990: 36) 


Mit dieser Ansicht unterwandert Chion in unverständlicher und bedauer- 
licher Weise sein eigenes Konzept. Zwar ist es plausibel, dass sich in einer 
visuell dominierten Kultur wie der unseren eine Reihe von referenziellen 
Klangobjekten unter der Dominanz des Bildes - die als eine kulturell- 
determinierte, nicht als eine in irgendeiner Form ontologisch verankerte 
gesehen wird — aus dem akustischen Kontext lösen. Daraus die Schluss- 
folgerung zu ziehen, dass es keine Tonspur gebe, heißt das Kind mit dem 


2 «En formulant qu'il n’y a pas de bande-son, nous voulons donc dire, pour commen- 
cer, que les sons du film ne forment pas, pris a part de l'image, un complexe en soi 
doté d’une unité interne, qui se confronterait globalement ä ce qu’on appelle la bande- 
image. Mais aussi, nous voulons dire que chaque élément sonore noue avec les élé- 
ments narratifs contenus dans l'image — personnages, action — ainsi qu'avec les élé- 
ments visuels de texture et de décor, des rapports verticaux simultanés bien plus 
directs, forts et prégnants que ceux que ce méme élément sonore peut nouer paralléle- 
ment avec les autres sons, ou que les sons nouent entre eux dans leur succession. C’est 
comme une recette: auriez-vous mélangé à part les constituants sonores avant de les- 
verser sur l'image, qu'une réaction chimique se produira qui désolidarisera les sons et 
les fera réagir chacun individuellement au champ visuel.» 
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Bade ausschiitten. Die ausdifferenzierte Architektur zeitgenössischer Ton- 
spuren zeichnet sich ja gerade durch ihre Souveränität aus, die sich unter 
anderem darin niederschlägt, dass sie gegenüber dem Bild einen Überfluss 
produziert, mit dem wir uns ansatzweise schon befasst haben (> 121), der 
jedoch hauptsächlich im Kapitel Musikalisierung der Tonspur (> 264) aus- 
gearbeitet wird. 

An dieser Stelle soll zunächst der Begriff der Souveränität noch ein- 
mal exemplifiziert werden. Mit Souveränität ist gemeint, dass die Tonspur 
aus einer Position der Eigenständigkeit in einen Dialog mit den anderen 
Elementen des Films tritt. Sie formuliert einen eigenständigen kommuni- 
kativen und emotional wirksamen Output, der unter anderem dadurch 
zustande kommt, dass ausdifferenzierte klangliche Elemente zueinander 
in Beziehung treten. Diese Beziehungen können sich auf einen vorformu- 
lierten Code mit einem spezifischen Regelwerk stützen. Dieser Code kann 
außerfilmisch etabliert sein wie im Fall von Sprache und Musik, er kann 
jedoch auch durch intertextuelle Bezüge konstruiert worden sein wie im 
Fall von Stereotypen. Wir erinnern uns an die Metalltür des vorhergehen- 
den Kapitels. Vor allem aber sind es die ausgeprägten sensorischen Qua- 
litäten, im genannten Beispiel die Schwere und Metalligkeit der Tür oder 
die basslastige dumpfe Klanglichkeit, die einen unmittelbaren emotiona- 
len Appell ausdrücken. 

Die anderen Elemente — auch dieses Statement gehört zum Credo 
dieser Arbeit — werden nicht allein durch die visuelle Repräsentation 
abgedeckt. Vielmehr verdankt die narrative Konstruktion einen Großteil 
ihrer kommunikativen Intentionalität und kohärenten Integration ver- 
schiedener disparater Elemente einem breit gefächerten Überbau, der sich 
aus der konstruktiven Tätigkeit des Rezipienten auf der Grundlage seiner 
Medienkompetenz und eines allgemeinen Weltwissens, aus relationalen 
Strukturen der Montage und nicht zuletzt aus dem Rückgriff auf einen ela- 
borierten sprachlichen Code ergibt. 


Kontrapunkt 


Die Frage nach einer adäquaten Verknüpfung von Ton und Bild hat vor 
allem zu Beginn der Tonfilmzeit die Gemüter erhitzt. 

Einige der kreativsten Vertreter des Stummfilms haben die Einfüh- 
rung des Tons nicht nur begrüßt. Im Manifest zum Tonfilm (1928) äußern 
Eisenstein, Pudowkin und Alexandrow die Befürchtung, dass der Ton- 
film nach einer ersten Periode von Sensationen zum konservierten Theater 
verkommen und seine gestalterische Eigenständigkeit verlieren könnte. 
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Sie weisen auf den Stellenwert der Montage hin, die sie als wesentliches 
Gestaltungsmittel des Films einstufen. Die Tonspur als redundante Ver- 
doppelung optischer Information, «die genau mit der Bewegung auf der 
Leinwand korrespondiert und eine gewisse Illusion sprechender Men- 
schen und hörbarer Objekte etc. vermittelt», würde die Zerstörung der 
Montagekultur bedeuten (1928: 43). 

Die Überlegungen Eisensteins et al. gehen auf Betrachtungen zur 
Rolle der Musik in Theater und Oper zurück, die Ende des 19., Anfang des 
20. Jahrhunderts als Reflex auf die romantische Konzeption des Gesamt- 
kunstwerks entwickelt wurden, in dem alle Elemente der Bühnendar- 
stellung Gestik, Mimik, Farben und Formen des Bühnenbilds, Musik und 
Sprache in einen gemeinsamen Ausdruck mündeten. Diese Kritik äußerte 
Busoni in seinem Entwurf einer neuen Ästhetik der Tonkunst: 


Der größte Teil neuerer Theatermusik leidet an dem Fehler, dass sie die 
Vorgänge, die sich auf der Bühne abspielen, wiederholen will, anstatt ihrer 
eigentlichen Aufgabe nachzugehen, den Seelenzustand der handelnden Per- 
sonen während jener Vorgänge zu tragen. Wenn die Bühne die Illusion eines 
Gewitters vortäuscht, so ist dieses Ereignis durch das Auge erschöpfend 
wahrgenommen. Fast alle Komponisten bemühen sich jedoch, das Gewitter 
in Tönen zu beschreiben, welches nicht nur eine unnötige und schwächere 
Wiederholung, sondern zugleich ein Versäumnis ihrer Aufgabe ist. Die Per- 
son auf der Bühne wird entweder von dem Gewitter seelisch beeinflusst, 
oder ihr Gemüt verweilt infolge von Gedanken, die es stärker in Anspruch 
nehmen, unbeirrt. [...] was in der Seele des Menschen währenddessen vor- 
geht, das Unsichtbare und Unhörbare, das soll die Musik verständlich ma- 
chen. (Busoni 1907: 16) 


Zu Beginn des Jahrhunderts haben die Begriffe Dissonanz und Kontrapunkt 
eine neue künstlerische Vorstellung geprägt, in welcher man sich die Aus- 
sage eines Werks als ein spannungsgeladenes «Dazwischen» vorstellte, 
das durch den Zusammenklang disparater Elemente entsteht und nicht 
auf Übereinstimmung und Redundanz beruht. Ein namhafter Vertreter 
dieser Auffassung ist neben Busoni Kandinsky, der sich im Umfeld avant- 
gardistischer Strömungen mit den gemeinsamen Kompositionsprinzipien 
von Musik und Malerei auseinandersetzte. Unter Kontrapunkt verstand er 
«das Zusammentreffen einzelner Formen, das Hemmen einer Form durch 
die andere, das Schieben, das Mit- und Zerreißen der einzelnen Formen, 
das Kombinieren des Verschleierten mit dem Bloßgelegten, des Rhyth- 
mischen mit dem Arrhythmischen» (Kandinsky 1911: 79). Begeistert von 
den atonalen Werken Schönbergs versuchte er, das moderne Moment der 
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Dissonanz, die er in seinen Uberlegungen als die Konsonanz von morgen 
beschreibt, in die Malerei zu tibertragen. 

Das Postulat einer kontrapunktischen Verwendung des Tons in Bezie- 
hung zum visuellen Montagebestandteil, wie es Eisenstein et al. fordern, 
schließt an die Überlegungen von Kandinsky, Busoni und anderen an. 


Die erste Arbeit mit dem Ton muss auf seine deutliche Asynchronität mit den 
visuellen Bildern ausgerichtet werden. [...] Der Ton wird, wenn er als neues 
Montage-Element verstanden wird (als ein vom Bild getrennter Faktor), 
zwangsläufig gewaltige Möglichkeiten zum Ausdruck und zur Lösung der 
kompliziertesten Aufgaben mit sich bringen, die wir jetzt, mit den Mitteln 
einer mangelhaften Filmmethode, nämlich der ausschließlichen Arbeit mit 
visuellen Bildern, nicht lösen können. (Eisenstein et al. 1928: 44) 


Auch René Clair bevorzugte in seinen Reflexionen zum Tonfilm die asyn- 
chrone Montage des Tons; auch für ihn bedeutete Asynchronität die Ver- 
meidung von Redundanz. «Es ist belanglos, das Klatschen zu hören, wenn 
man die Hände sieht, die applaudieren»® (Clair 1929: 152). Clair war fas- 
ziniert von der Erweiterung des Raums durch den Ton und der Überlage- 
rung zeitgleicher Ereignisse auf der Bild- und Tonebene. Die Beispiele aus 
Broapway MELoDy (USA 1929, Harry Beaumont), die Clair in seinen Refle- 
xionen aufführt, belegen jedoch, dass er mit Asynchronität nichts weiter 
meinte als Sprache oder Geräusche von unsichtbaren Objekten. 

Die Begriffe Kontrapunkt und Asynchronität sind nicht unproblematisch. 
Sie haben sich deshalb im ursprünglichen Sinn nicht erhalten. Ich gehe mit 
Chion (1990: 34) einig, dass man die kontrapunktische Montage eher als Dis- 
sonanz beschreiben muss, da sie sich vertikal über punktuell fehlende Über- 
einstimmungen zwischen Bild und Tonentwickeln. Der Begriff Asynchroni- 
tät auf der anderen Seite meint in der Sprache der Filmpraxis etwas anderes, 
nämlich die fehlerhafte zeitliche Verschiebung des Bild- und Tonmaterials. 


See a dog - hear a dog 


Der Mainstreamfilm hat sich nicht an die Empfehlungen von Eisenstein, 
Clair und anderen gehalten. Im Gegenteil, die wenigen Geräusche, die im 
klassischen Hollywood-Kino überhaupt montiert wurden, bezogen sich 
fast ausschließlich auf Objekte der bildlichen Darstellung. 


3 «Il importe peu d'entendre le bruit des applaudissements si l'on voit les mains qui 
applaudis-sent.» 
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Die geringe Auflösung des Lichttons und die fehlende Kompetenz 
des Publikums führten dazu, dass außer Signalen — Hupen, Pfeifen und 
Sirenen — und einigen wenigen, sehr gut etablierten Geräuschen wie Stim- 
mengewirr oder Vogelgezwitscher keine Geräusche ohne entsprechende 
visuelle Verankerung der Quelle eingeführt wurden. Die Geräusche lei- 
den gegenüber der Sprache und der Musik stärker unter dem mangel- 
haften Frequenzgang, weil sie großenteils nicht harmonisch aufgebaut 
sind. Bei harmonischen? Klangobjekten, bei der Musik und den Vokalen 
in der menschlichen Sprache, ergänzt das menschliche Gehirn den Grund- 
ton auch dann, wenn er außerhalb des Übertragungsbereichs liegt. In der 
Klasse der Geräusche haben einige Signale sowie Tierstimmen eine har- 
monische Struktur. Außerdem sind sie in einem mittleren Frequenzbereich 
angesiedelt, der sich mit der damaligen Technologie am besten abbilden 
ließ. 

Unter den unvorteilhaften technischen Voraussetzungen des Licht- 
tons war es nicht nur eine Befürchtung, sondern eine Tatsache, dass viele 
Klangobjekte nicht auditiv identifiziert werden konnten. Burch (1973: 200) 
zitiert ein prasselndes Geräusch, das von der einen Hälfte der Zuschauer 
als Regen, von der anderen Hälfte als Applaus gedeutet wurde. 

Anders ausgedrückt: Das filmische Medium wurde aufgrund techni- 
scher Unvollkommenheiten und mangelnder Erfahrung der Rezipienten 
als brüchig empfunden. Dieser Brüchigkeit versuchte man in der Holly- 
wood-Klassik entgegenzuwirken, indem man die dargestellten Objekte 
und Handlungen doppelt codierte, optisch und akustisch. Die dabei ent- 
stehende Redundanz, welche die Autoren des Manifests explizit kritisiert 
hatten, wirkte der Gefahr der möglichen Unverständlichkeit entgegen, 
die man nach dem Verständnis der Hollywood-Klassik unbedingt zu ver- 
meiden hatte. Das erzählerische Material wurde so organisiert, dass es 
eindeutig und klar verständlich war. Die Geräusche sollten keine eigene 
akustische Qualität besitzen, sondern möglichst schnell und problemlos 
einen bestimmten Vorgang oder eine bestimmte Quelle bezeichnen, um 
die nahtlose Fiktion zu unterstützen. Die Tonspur wurde unter diesen 
Prämissen funktionalisiert und dem narrativen und visuellen Fluss ange- 
passt. 

Die Beziehung zwischen visueller und akustischer Darstellung war 
im Kontext der Hollywood-Klassik reziprok, was gerade in der Floskel 
See a dog - hear a dog zum Ausdruck kommt. Jedes lebendige oder bewegte 
Objekt musste mit einem entsprechenden Geräusch versehen werden: 


4 Harmonische Klangobjekte setzen sich aus einem Grundton und mehreren Obertönen 
zusammen, deren Frequenz ganzzahlige Vielfache der Grundfrequenz sind. 
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Kein Pferd kommt ins Bild, ohne zu schnauben oder zu wiehern, jedes 
Schaf blökt, jeder Hahn kräht. Schritte und Türen sind dezent, aber obliga- 
torisch zu hören und nicht nur das: Sie bilden häufig die einzigen Klang- 
objekte auf der Tonspur. Solche handlungsgebundenen Geräusche, wie ich 
sie nenne, Geräusche, die mit den sichtbaren Bewegungen und Handlun- 
gen korrelieren, machen in der Periode von 1933 bis Ende der 1960er-Jahre 
einen Großteil aller wahrnehmbaren Klangobjekte aus. Zu dieser Gruppe 
zähle ich außer den Schritten auch die nicht sprachlichen menschlichen 
Geräusche wie Lachen, Schreien oder Faustschläge. Besonders in den 
1940er-Jahren sind statistische Häufungen solcher handlungsgebundener 
Klangobjekte zu verzeichnen mit beispielsweise 10 bis 20% Türgeräu- 
schen und 10 bis 25% Schrittgeräuschen. 


Intermodale Assoziation von Ton und Bild 


Der Film als heterogenes Medium spaltet den Informationsfluss in zwei 
Kanäle, einen optischen und einen akustischen Kanal. Sie bleiben im 
Produktionsprozess von der Aufnahme bis zur Wiedergabe getrennt und 
werden erst durch die Wahrnehmung des Zuschauers wieder zusam- 
mengesetzt. In der Bewältigung der polyphonie informationnelle — wie 
Barthes dieses Zusammenspiel sehr anschaulich genannt hat - bringt 
der Zuschauer sich selbst ins Spiel, sein Gefühl dafür, wie die verschie- 
denartigen Reize zusammenhängen, die über Auge und Ohr in ihn ein- 
ziehen. 

Im wirklichen Leben sind das homogene raumzeitliche Milieu und 
die Konstanz der Gegenstände gegeben. Die Wirklichkeit ist so ver- 
standen ein kontinuierliches Universum. Der Film löst diese Kontinui- 
tät zunächst in eine Reihe von Fragmenten auf und ordnet sie später 
als narratives System so, dass sie eine kohärente Illusion schaffen. Der 
Rezipient knüpft das Netz aus den einzelnen Fäden, die das filmische 
Werk ihm anbietet. Die Diegese — das raumzeitliche Kontinuum als sinn- 
volles Ganzes - entsteht durch die konstruktive gedankliche Tätigkeit 
des Zuschauers. 

Es ist deshalb überraschend, dass wir so selbstverständlich mit der 
Situation der Filmwahrnehmung umgehen. Tatsächlich ist kaum ein Trai- 
ning nötig, um einfach gestrickte Filme zu verstehen." Vielmehr benutzt 
der Film ein bestehendes System der Informationsverarbeitung, das einer- 


5 Medienungewohnte Zuschauer haben vor allem Mühe, Umstellungen der zeitlichen 
Ordnung wie beispielsweise Rückblenden oder erzählerische Transformationen wie 
z.B. Träume zu verstehen. 
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seits mit der genetisch bedingten Ausdifferenzierung spezifischer Wahr- 
nehmungskanäle angeboren ist, andererseits laufend im Alltag gefestigt 
wird.° 

Helmholtz (1862: 13) hatte in der zweiten Hälfte des 19. Jahrhun- 
derts festgestellt, dass die einzelnen Sinnesmodalitäten auf spezifische 
Energien ausgerichtet sind. Er beschreibt die Sinnesmodalitäten als 
Qualitätenkreise, zwischen denen es keinen kontinuierlichen Übergang 
und keine objektivierbaren Vergleiche gibt, zum Beispiel zwischen blau 
und süß oder rund und laut. Mit anderen Worten: Wir nehmen die Welt 
fragmentiert wahr. Die Sinne entnehmen ihr jene Informationen, die so 
dimensioniert sind, dass sie von den Sensoren in Empfindungen über- 
setzt werden können. Wie Foerster (1988: 34) darstellt, hatte der Biologe 
Johannes Müller schon vor Helmholtz ein noch radikaleres Konzept der 
spezifischen Sinnesenergie entworfen, dessen Bedeutung die wissen- 
schaftliche Forschung erst 100 Jahre später erkannte. Dieses Prinzip der 
undifferenzierten Codierung formuliert Foerster (1988: 35) folgendermaßen: 
«Die Erregungszustände aller Rezeptoren codieren nur die Intensität, 
aber nicht die physikalische oder chemische Natur der Erregungssache: 
Codiert wird nur «So-und-so-viel an dieser Stelle meines Körpers, aber 
nicht <Was>.» 

Wie schon kurz angesprochen, basierten die Gedächtnistechnolo- 
gien, die ebenfalls in der zweiten Hälfte des 19. Jahrhunderts entstan- 
den sind, von Anfang an auf diesen Erkenntnissen, indem sie aus dem 
energetischen Kontinuum jene Dimensionen auswählten, die exakt auf 
das menschliche Wahrnehmungssystem zugeschnitten waren. Diese 
nativistische Sichtweise mag erklären, warum das Kino universell ver- 
ständlich ist. 

Es gehört zu den genuinen Verfahrender menschlichen Objektwahr- 
nehmung, dass die verschiedenen Empfindungen aus den einzelnen 
Sinnbezirken assoziativ miteinander verknüpft werden. Diese Assozia- 
tionsleistung wird im Folgenden als intermodale Assoziation (cross-modal 
association) bezeichnet. Sie ist terminologisch und funktional von der 
Synästhesie zu unterscheiden, mit welcher die Projektion einer Modalität 


6 Als gesichert gilt, dass die Integration verschiedener Sinnesdaten ab dem dritten 
Lebensmonat vorhanden ist. Drei bis vier Monate alte Säuglinge konnten in einer 
Untersuchung von Spelke (1979, in Dornes 1992) Bild und Ton einander zuordnen und 
bemerkten sogar eine Asynchronität von 4/10 Sekunden. Dornes (1992: 44 f.) zitiert 
eine Untersuchung von Aronson und Rosenbloom, die schon bei 30 Tage alten Säug- 
lingen eine Irritation festgestellt haben, wenn diese ein sprechendes Gesicht sehen und 
die Stimme, die sie hören, nicht aus dem Mund kommt, sondern von der Seite. Ähnli- 
che Effekte beobachteten die Forscher, wenn dem sprechenden Gesicht der Mutter eine 
fremde Stimme unterlegt wurde. 


Intermodale Assoziation von Ton und Bild 139 


in eine andere bezeichnet wird, also zum Beispiel das Entstehen von Farb- 
eindrücken beim Musikhören. 

Die intermodale Assoziation und damit die Annahme einer Kausa- 
litätsbeziehung zwischen optischen und akustischen Reizen ist funda- 
mental an ihre gleichzeitige Darbietung gebunden. Dieser Befund ist mit 
der bereits dargestellten Netzwerkarchitektur des Gehirns gut zu erklä- 
ren. Zur Lösung des Bindungsproblems, wie Singer (1997) die Anfor- 
derung zur Integration verschiedener Stimuli bezeichnet, muss man 
annehmen, «dass räumlich verteilte Nervenzellen ihre Antworten syn- 
chronisierenmüssen, wenn sie sich an der Codierung einer kohärenten 
Figur beteiligen. [...] Der Grund ist, dass gleichzeitig eintreffende synap- 
tische Potenziale sich in nachgeschalteten Zellen besonders gut summie- 
ren» (Singer 1997: 53). Das wiederholt auftretende synchrone Feuern von 
neuronalen Verbänden führt ebenfalls zu einer verstärkten Gewichtung 
dieser Konnektionen. «Wissen über konsistente Beziehungen zwischen 
Phänomenen in der Welt wird auf diese Weise internalisiert und steht 
hinfort für die Interpretation sensorischer Signale zur Verfügung» (Sin- 
ger 1997: 61). Auf der Grundlage dieses Modells lassen sich synästheti- 
sche Wahrnehmungen ebenfalls erklären, indem die durch regelmäßigen 
Gebrauch aktivierten Konnektionen als so ausgeprägt erscheinen, dass 
sie als integrativer Bestandteil der mentalen Repräsentation mit aktiviert 
werden. 

Für die notwendige Genauigkeit ist die zeitliche Auflösungsfähigkeit 
des trägeren Sinnesorgans, des Auges, ausschlaggebend. «Aus zahlreichen 
experimentellen Beobachtungen kann man ableiten, dass die beste zeitli- 
che Auflösung für das Hören, die schlechteste für das Sehen gilt» (Pöppel 
1997: 74). Sie beträgt für das Hören circa 3ms, für das Sehen 20 bis 30 ms. 
Diese Trägheit ist ja, wie bereits vermerkt, eine notwendige Voraussetzung 
für die Auflösung des optischen Datenflusses in einzelne Phasenbilder. 
Zeitliche Ordnungsschwellen, die für die Unterscheidung von Sinnes- 
eindrücken in ein sequenzielles Vorher-nachher-Muster zuständig sind, 
bestimmen die zeitlichen Toleranzgrenzen für die assoziative Funktion. 
Sie liegt bei etwa 30 ms. Pöppel (1997: 80 ff.) führt diese Toleranzzonen auf 
eine interne Taktrate des Gehirns zurück, welche die verschiedenen räum- 
lich getrennt ablaufenden Prozesse synchronisiert. 


Indem das Gehirn solche zeitlosen Zonen benutzt, kann es überhaupt erst 
mit den Reizen der Welt, die ihre eigene Zeitlichkeit haben, umgehen. Wenn 
alles so aufgenommen würde, wie es über unsere Sinnesorgane in uns hinein- 
strömt [...], dann würden wir in einem Chaos von ungestalteter Information 
versinken. (Pöppel 1997: 84) 
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Weil sie diese Zeitgenauigkeit nicht liefern konnten, scheiterten frühe 
Technologien wie die mechanischen Koppelungen von Projektoren mit 
Grammophonen in der Tonbildzeit 1900 bis 1913 (dargestellt in Jossé 
1984). Erst als Mitte der 1920er-Jahre die elektrische Koppelung von 
Bild- und Tonträgern mittels Wechselstrom zur Verfügung stand, war die 
Genauigkeit hinreichend, um die Illusion einer kausalen Beziehung zwi- 
schen Bild und Ion zu erzeugen. Noch robuster waren dann die Verfahren, 
bei welchen Bild und Ton auf einem einzigen Wiedergabemedium vereint 
wurden. 

Diese Genauigkeit ist neben der transparenten Auflösung der wich- 
tigste Faktor für die Glaubwürdigkeit der Ton-Bild-Relation. Wie ext- 
reme Genres zeigen — der Science-Fiction-Film in der Abbildung interga- 
laktischer Welten, der Animationsfilm als äußerst realitätsferne Kunst —, 
sind wir bereit, unwahrscheinliche Verbindungen zu akzeptieren, wenn 
uns durch die minutiöse zeitliche Koinzidenz ein Ursache-Wirkungs- 
Verhältnis suggeriert wird. Die zeitliche Übereinstimmung ist allerdings 
nur ein notwendiger, kein hinreichender Faktor für visuell-auditive 
Assoziationen. 


Synchrese 


Die Sensation des Films liegt in seiner Fähigkeit, Raum und Zeit in der 
Bewegung zu konservieren und losgelöst vom raum-zeitlichen Konti- 
nuum seiner Aufnahme zu einer anderen Zeit und an einem anderen 
Ort wieder in der Bewegung zu entfalten. Seine Essenz, so könnte man 
verknappend behaupten, ist die Bewegung. Bewegung, wo immer sie 
stattfindet, erzeugt Klang, der sich minutiös an die optische Erschei- 
nung der Bewegung anschmiegt. Das lautlose bewegte Bild erzeugt das 
Gefühl eines Mangels, die Bewegung wird optisch als phasenweise Ver- 
lagerung auf die Leinwand projiziert, es fehlt ihr eine objektivierbare 
Zeitdimension. Deshalb wurde die Vorführgeschwindigkeit erst mit 
der Einführung des Tonfilms standardisiert. Jedes akustische Gesche- 
hen ist untrennbar an die Dimension der Zeit gebunden. Der Ton ist 
Phänomen gewordene Zeit. Deshalb vereinheitlicht er im Kino nicht 
nur die Zeitempfindung. Indem die einzelnen akustischen Erscheinun- 
gen die Zeit in kurze Intervalle auflösen, strukturieren sie den Zeit- 
fluss, entweder in regelhafter Weise - wie im musikalischen Rhythmus 
und in der Gliederung des Sprachflusses in einzelne Phoneme - oder 
scheinbar zufällig verteilt wie in der Anordnung von unterschiedlichen 
Lautobjekten. 
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Der Funktion, das filmische Geschehen zeitlich zu gliedern, misst 
Chion (1990) aus diesem Grund grofse Bedeutung zu. Er hat fiir die zeitli- 
che Anpassung von Bild und Ton den Begriff Synchrese geschaffen: 


Die Synchrese (ein Wort, das ich aus den Begriffen «Synchronismus» und 
«Synthese» zusammengesetzt habe) ist die unwiderstehliche und spontane 
Verbindung, die zwischen einem akustischen und einem kurzen optischen 
Phänomen entsteht, wenn die beiden zeitgleich auftreten, und zwar unab- 
hängig von jeder rationalen Logik.’ (Chion 1990: 55) 


Die Synchrese beruht auf dem zuvor beschriebenen Mechanismus 
der Zuordnung von Reizen in verschiedenen Modalitäten. Sie ist eine 
Grundvoraussetzung für die Substitution von Originaltönen durch die 
Praktiken der Nachsynchronisation, der Geräuschemacher und der Ton- 
montage.® 

Wie Wuss (1993: 292) schreibt, ist es «die asymmetrische Anlage der 
Wahrnehmungssysteme, die fiir einen Vorteil bei der Informationsauswer- 
tung sorgt. Ein System kann jeweils gegentiber dem anderen ein Korrektiv 
schaffen, kann regulierend auf das andere einwirken.» Dies gilt in beson- 
derem Maß für die Interaktion zwischen Bild und Ton auf der Zeitachse, 
die mit dem Begriff Synchrese global umfasst wird. Unter den zeitlichen 
Phänomenen schenkt Chion vor allem zwei Verfahren große Aufmerksam- 
keit: dem point de synchronisation und der Kontinuität. 

Die Auflösung des Bildflusses in Einzelbilder führt dazu, dass die 
optische Repräsentation extrem schnelle Bewegungen oder Berührun- 
gen nicht adäquat wiedergeben kann. Chion (1990: 53) führt als Beispiel 
den Faustschlag an, der im wirklichen Leben kaum ein Geräusch ver- 
ursacht. Im Repertoire der Geräuschproduktion für den Film hingegen 
nimmt er einen prominenten Platz ein, darin sind sich auch die Sound 
Designer einig. Er gehört zu den am besten gepflegten Stereotypen des 
Mainstreamfilms, den die meisten Leute nur aus dem Kino kennen. 


7 «La synchrése (mot que nous forgeons en combinant «synchronisme» et «synthése») 
est la soudure irrésistible et spontanée qui se produit entre un phénomène sonore et 
un phénomène visuel ponctuel lorsque ceux-ci tombent en même temps, cela indépen- 
damment de toute logique rationnelle.» 

8 Zur entwicklungspsychologischen Grundlage der Synchrese verweist Chion auf eine 
Untersuchung von Delalande/Celeste (genauere Angaben zur Quelle fehlen bedauer- 
licherweise), welche sich mit der magischen Lautproduktion des Kindes befasst haben. 
In der magischen Welt des Kleinkinds werden symbolische Gegenstände im Spiel 
über Onomatopöen mit den entsprechenden Tönen versorgt: eine Streichholzschach- 
tel, die ein Auto darstellt, zum Beispiel mit einem Brummen. Diese magische Art der 
Geräuschzuschreibung zu unbelebten Objekten hat bis heute im Animationsfilm über- 
lebt (> Verfremdung 277). 
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Ein «Synchronisationspunkt» ist bei der audiovisuellen Darstellung ein 
spezifischer Augenblick, in dem ein Bild- und ein Tonelement gleichzeitig 
auftreten.’ (Chion 1990: 52) 


Das Konzept ist von Bedeutung, der Begriff jedoch aus meiner Sicht 
unbrauchbar. Mit Synchronisationspunkt bezeichnet er eine Markierung zur 
zeitlichen Justierung von Ton und Bild. Ich schlage deshalb den Begriff 
Akzentuierung vor. Es geht ja darum, einzelne Momente des optischen 
Kontinuums durch die simultane Montage eines Klangobjekts zu privi- 
legieren, ähnlich wie der erste Schlag im musikalischen Takt, und darüber 
einen Rhythmus zu schaffen. 


Mehrwert 


Als Mehrwert bezeichne ich den Ausdrucks- und Informationswert, mit 
dem ein Ton ein gegebenes Bild anreichert. Das kann so weit gehen, dass 
man über den unmittelbaren Eindruck oder die Erinnerung annimmt, dass 
diese Information oder dieser Ausdruck sich «natürlich» aus dem erge- 
be, was man sieht, und schon im Bild allein enthalten sei. Dadurch kann 
sogar der offensichtlich falsche Eindruck erweckt werden, dass der Ton 
überflüssig sei und eine Bedeutung nur verdopple, die er in Wirklichkeit 
herbeiführt oder schafft, sei es von Grund auf oder über die Differenz zum 
Sichtbaren. 

Dieses Phänomen des Mehrwerts funktioniert vor allem bei synchroner Dar- 
bietung von Bild und Ton über das Prinzip der Synchrese, die es erlaubt, eine 
unmittelbare und notwendige Beziehung zu schaffen zwischen dem, was 
man sieht, und dem, was man hört.'? (Chion 1990: 8) 


Mehr noch als die Synchrese legt die valeur ajoutee, die ich deutsch als 
Mehrwert bezeichnen werde, das Gewicht auf die Bedeutungsebene die- 
ser Interaktion. Chion hat mit seiner Terminologie und seiner gedankli- 
chen Konzeption zwar ein Instrumentarium geschaffen, das als Grund- 


9 «Un point de synchronisation, c'est, dans une chaîne audio-visuelle, un moment sail- 
lant de rencontre synchrone entre un moment sonore et un moment visuel.» 

10 «Par valeur ajoutee, nous designons la valeur expressive et informative dont un son 
enrichit une image donnée, jusqu’a donner à croire, dans l’impression immediate 
qu’on en a ou le souvenir qu’on en garde, que cette information ou cette expression 
se dégage «naturellement» de ce qu'on voit, et est déjà contenue dans l'image seule. 
Et jusqu’à procurer l'impression, éminemment injuste, que le son est inutile, et qu'il 
redouble un sens qu’en réalité il améne et crée, soit de toutes piéces, soit par sa diffé- 
rence méme d’avec ce qu’on voit.» 
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lage sehr nützlich ist. Dennoch fehlt nach wie vor eine konsistente 
Theorie, welche die Funktionsweisen solcher Interaktionen systema- 
tisch beschreibt. Als Basis fiir die folgende Diskussion der Bedeutungs- 
bildung im Austausch zwischen Ton und Bild werden deshalb neuere 
Konzeptionen der Semantik herangezogen, die den dynamischen Aspekt 
von Bedeutungen untersuchen (Goschke/Koppelberg 1993, Jaeger 1994, 
Linke et al. 1991). 

Der Mehrwert bezeichnet einen energetischen Fluss zwischen zwei 
Konzepten, tiber den ein drittes entsteht, das weder aus dem einen noch 
aus dem anderen erklart werden kann. Diese Form der Bedeutungskons- 
titution ist nicht eine Gegebenheit, sondern ein Prozess der Modifikation. 
Sie ist daher eine dynamische Form der Bedeutungserzeugung. Damit ist 
nichts anderes gemeint als eine Veränderung der tatsächlichen oder mög- 
lichen Eigenschaften eines Objekts. In der Interaktion zweier Konzepte — 
eines akustischen und eines optischen - treten einige Merkmale hervor, 
während andere sozusagen in Narkose versetzt werden. Goschke/Kop- 
pelberg (1993: 83) weisen darauf hin, dass Konzepte grundsätzlich keine 
stabilen, invarianten Strukturen sind. Die mentalen Repräsentationen im 
Langzeitgedächtnis werden laufend anhand neuer Erfahrungen verän- 
dert und angepasst. Der Eindruck der Stabilität von Konzeptstrukturen dürfte 
vielmehr ein Artefakt der Mittelwertbildung über viele Personen, Kontexte und 
Aufgaben sein. Damit kommt eine Variable ins Spiel, die für die weitere 
Betrachtung wichtig sein könnte: die Typikalität, die im Folgenden erklärt 
werden soll. Aktuelle Repräsentationen von Objekten (token) können als 
verschieden typisch aufgefasst werden je nachdem, wie sehr sie mit dem 
oben beschriebenen Mittelwert übereinstimmen oder sich von ihm unter- 
scheiden: Eine Amsel ist ein typischerer Vogel als ein Pinguin. Prototypen 
zeichnen sich dadurch aus, dass sie diesen Mittelwert annähernd ideal 
repräsentieren. Beispiele von Prototypen auf der Tonspur wären etwa der 
satt klingende Schuss, die dezent klackende Türe, John Waynes Faust- 
schlag. 

Der Grad der Typikalität, welche die optische und die akustische 
Repräsentation prägt, bestimmt - so eine erste These -, wie groß der 
Mehrwert ist, der zwischen den beiden Darstellungen entsteht. Nehmen 
wir als Beispiel das notorische Pferdegetrappel, vom Geräuschemacher 
mit zwei halben Kokosnussschalen erzeugt. Von den Myriaden denk- 
barer Klangobjekte, die durch die Hufe von Pferden auf verschiedenem 
Untergrund ja nach Situation entstehen können, vertritt dieses Geräusch 
den oben erwähnten prototypischen Durchschnitt. Interessanterweise 
kommt diese prototypische Stilisierung gerade durch die künstliche 
Substitution zustande, da in der Studiosituation die immer gleichen stan- 
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dardisierten Geräuscherzeuger zur Verfügung stehen. Die Funktion des 
Pferdegetrappels ist in erster Linie der Hinweis auf eine Quelle, sprach- 
lich zu fassen als «da ist ein Pferd»; indem die Aussage nicht über diesen 
Hinweis hinausgeht, deckt sie sich mit der visuellen Wahrnehmung weit- 
gehend: Wir sehen die Quelle, also das Pferd. Auch das Pferd im Bild ist 
im klassischen Hollywoodfilm idealerweise kein spezifisches Exemplar, 
kein Schimmel beispielsweise. Damit besteht zwischen den beiden Dar- 
stellungsformen größtmögliche Redundanz, die Zuordnung erfolgt auto- 
matisch und problemlos. Die Konzepte verschmelzen zu einem relativ 
stabilen Konzept, ohne dass dabei etwas Neues entsteht. Der Mehrwert 
tendiert gegen Null. 

Der Mechanismus der Interaktion wird entschieden komplexer, wenn 
instabile oder mehrdeutige Konzepte in einen Austausch miteinander 
treten. 

Ein solcher Fall soll im Folgenden am Beispiel eines fiktionalen 
Objekts, des Laserschwerts aus STAR Wars (USA 1977, George Lucas), 
diskutiert werden. Es wird in der Szene etabliert, in welchem der Onkel 
Luke Skywalker über seine Herkunft orientiert (0.30.53-0.35.02). Bevor wir 
es sehen, benennt Kenobi den Gegenstand als «das Lichtschwert deines 
Vaters» («your father’s light sabre»). Ausgeschaltet sieht es aus wie ein kur- 
zer Metallstock, eingeschaltet wie eine leuchtende Neonröhre (Abb. 7-8). 

Zunächst die sprachliche Benennung, dann die erste Anwendung 
(0.42.10-0.48.16) ordnet das Objekt der Klasse der Waffen zu. Zwischen 
optischer Darstellung und behaupteter Funktion besteht allerdings eine 
gewisse Diskrepanz, die der Sound Designer Ben Burtt über akustische 
Merkmale abbauen musste. Dem Bild fehlt das Merkmal gefährlich, das für 
die Zuordnung zur Klasse der Waffen obligatorisch ist. 

«Da ich eine naturwissenschaftliche Ausbildung genossen habe, gehe 
ich zunächst ganz faktisch vor. Ich frage mich: «Wenn dieses geräusch- 
produzierende Objekt tatsächlich existieren würde, wie würde es klin- 
gen? Ich beginne meine Arbeit also mit einem naturwissenschaftlichen 
Ansatz» (Burtt in LoBrutto 1994: 142)." Die physikalische Ähnlichkeit, 
auf welche Burtt das Klangobjekt aufbaute, war ein nicht funktionieren- 
des Fernsehgerät, das ein unangenehmes Summen produzierte. Dieses 
Summen spielte er einem Lautsprecher zu, vor den er sich mit einem 
Interferenz-Richtmikrofon” stellte, mit dem er bildsynchron die Bewe- 


11 «Since I was trained scientifically, part of my attitude is first a literal one. I ask myself, 
«If this sound-producing object really existed, what would it sound like? So I start out 
with a scientific’view.» 

12 Mikrofon mit keulenförmiger Richtcharakteristik, bei dem die seitlich einfallenden 
Schallwellen aufgrund der Bauform durch Interferenzen gedämpft werden. 
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gungen ausführte. Darüber erzeugte er sowohl eine exakte zeitliche 
Anpassung von minimalen klanglichen Veränderungen an die sichtbaren 
Veränderungen im Bildraum, welche die Glaubwürdigkeit der rezipro- 
ken Beziehung unterstützt, als auch eine Phasing genannte Klangmodu- 
lation, die dann entsteht, wenn Interferenzmikrofone in einem diffusen 
Klangfeld mit breitbandigem Rauschen bewegt werden. Dieses Phasing 
ist normalerweise ein Charakteristikum von extrem schnell bewegten 
Objekten, Düsenjets zum Beispiel. Auf das Ein- und Ausschalten des 
Laserschwerts - bildlich dargestellt als Transformation des Metallstabs 
in die oben beschriebene Neonröhre — montierte er ein kurzes unange- 
nehmes Zischen. Außerdem ist immer, wenn der Lichtstrahl einen Feind 
berührt, ein ätzendes Knistern zu hören, wie von Elektrizität oder großer 
Hitze, die einen feuchten Gegenstand verschmort. Die Konsequenz dieser 
extrem gewalttätig klingenden Berührungen wird in der ersten Anwen- 
dung des Laserschwerts auch bildlich konkret in Form eines abgetrennten 
Arms dargestellt. 

Die Objektkonstitution vollzieht sich also über die Integration dis- 
parater Merkmale, die weit über die reine Hinweisfunktion hinausgehen. 
Spezifische Merkmale etablieren Funktionen einschließlich Konsequen- 
zen, Prozesse, eine hypothetische materielle Beschaffenheit und sinnliche 
Qualitäten. Die sprachliche Benennung öffnet ein bestimmtes semanti- 
sches Register, das nach und nach ausdifferenziert wird. Das Klangob- 
jekt selbst besteht aus verschiedenen Teilkonzepten, die verschiedenen 
Prozessen zugeordnet werden: die Klangmodulation der Bewegung im 
Raum, das Zischen der Funktionsaufnahme, das Knistern der Berührung. 
Die klanglichen Qualitäten mobilisieren Sinneserfahrungen aus der All- 
tagswelt: die Assoziation zu Geschwindigkeit und Potenz über das Pha- 
sing, zu negativen Erfahrungen mit Strom und Hitze über das ätzende 
Knistern. Während die zeitliche Übereinstimmung von Ton und Bild die 
Kausalitätsbeziehung festigt, werden über das Zischen zwei verschie- 
dene Zustände des Objekts - ein und aus — miteinander verbunden, das 
heißt, Kontinuität geschaffen. Einmal etabliert, kann sich diese Transfor- 
mation auch außerhalb des Bildfelds abspielen und wird dann nur noch 
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akustisch repräsentiert. Diese asymmetrische Bedeutungszuordnung ist 
schon nach der ersten Exposition gefestigt. Die hypothetische materielle 
Beschaffenheit des Laserschwerts wird über die Ähnlichkeit der abgebil- 
deten Quelle mit der substituierenden Quelle - der Bildröhre des Fernse- 
hers - erzeugt. Diese Übertragung kann als Assimilation - als Anpassung 
an bestehende mentale Repräsentationen von ähnlichen Objekten — ver- 
standen werden. 

Am Beispiel Laserschwert wird eine Tendenz sichtbar: Der Effekt der 
Modifikation ist umso größer, je weniger Redundanz zwischen der Dar- 
stellung der Objekte auf der Bild- und Tonspur besteht. 

Das Postulat meiner Überlegungen zu diesem Prozess lautet: Grund- 
sätzlich hat ein Klangobjekt mit hoher Auflösung eine deutlichere Aus- 
wirkung auf die visuelle Repräsentation. Es kann in einer unendlichen 
Zahl von Spielarten in unendlich vieler Hinsicht realisiert werden. Es 
kann mehrdeutig sein oder unscharfe Teilkonzepte beinhalten: im Fall des 
Laserschwerts zum Beispiel das Zischen, das nichts Bestimmtes bedeu- 
tet, auf jeden Fall kein eindeutiges Bild erzeugt. Das Zischen ist aufgrund 
dieser Unschärfe extrem kontextsensitiv und kann in Verbindung mit 
ganz unterschiedlichen Quellen treten, in Burtt/Lucas’ Universum unter 
anderem auch mit den berühmten automatischen Türen in den Raumsta- 
tionen und Raumschiffen, denen es einen pneumatischen Mechanismus 
zuschreibt. 

Im Prozess der intermodalen Assoziation kombiniert der Rezipient 
die unterschiedlichen Merkmale, die sich aus den bildlichen und klang- 
lichen Repräsentationen ergeben, zu einem sinnvollen Ganzen. Das sind 
Merkmale der Form, der Farbe, der Oberflächentextur, die sich im Bild 
manifestieren; es sind Prozesse und Bewegungen, die sich in der Syn- 
chrese einander anpassen; es sind physikalische Eigenschaften, die aus 
der klanglichen Form induziert werden, und affektive Qualitäten, die mit 
der Klanglichkeit korrespondieren. Je weiter die Darstellungen sich von 
einer prototypischen Vereinfachung entfernen, umso größer ist der Mehr- 
wert, der dabei entsteht. Das souveräne Klangobjekt, so habe ich weiter 
vorne argumentiert (> 121), zeichnet sich durch eine Ausdifferenzierung 
von fakultativen Merkmalen aus. Diese Merkmale sind ein Maß für die 
Abweichung von der Typikalität. Goschke/Koppelberg (1993: 93) haben 
dafür den Begriff Distanz vorgeschlagen. Andere Autoren arbeiten mit 
metaphorischen Umschreibungen, die sie der Thermodynamik entlehnen. 
Standardisierte Konzepte werden als «fest» (Wheelwright 1960: 110) oder 
als «gefroren» (Jaeger 1994), dynamische Konzepte als «flüssig» beschrie- 
ben. Ausdifferenzierte Repräsentationen sind demnach flüssig, da sie sich 
ständig ändern, sowohl was die Zusammensetzung als auch die Gewich- 
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tung ihrer Merkmale anbelangt. Damit generieren sie ein gewisses Mafs an 
Inkonsistenz, man könnte auch sagen an Verrätselung, das vom Rezipien- 
ten durch einen Akt der Interpretation abgebaut werden muss. «Intelli- 
genz beinhaltet, dass eine Instanz Objekte wahrnehmen kann, die sie noch 
nicht kennt, und ebenso bekannte Objekte in einer neuen Umgebung, in 
welcher derselbe Reiz anders erscheint als zuvor» (Jaeger 1994: 44). Das 
Abbauen von Inkonsistenz kann mit Piaget als Prozess der Assimilation 
bezeichnet werden. «Die Person behandelt Ereignisse in der Umwelt so, 
dass sie für ihre Strukturen passender werden, [...] sie bezieht Züge der 
äußeren Realität in ihre eigenen psychologischen Strukturen ein» (Gins- 
burg/Opper 1969: 33). Damit integriert der Rezipient die Merkmale der 
Objekte in bestehende mentale Repräsentationen, die dadurch gleichzeitig 
dank der zuvor angesprochenen Plastizität modifiziert werden. 

Die Gefühlswerte, die in diesem Prozess entstehen, können dadurch 
erklärt werden, dass die mentale Repräsentation der einzelnen Merkmale 
von der Geschichte des Individuums geprägt ist. Über die aktuelle Reprä- 
sentation wird somit ein psychisches Unterprogramm (Wuss 1993) akti- 
viert. Es ist ein anerkanntes Problem semantischer Theorien, dass es keine 
überzeugenden Konzepte gibt, die den Unterschied erklären zwischen 
dem Bezug der Repräsentation auf die äußere Welt und dem subjekti- 
ven Charakter dieser Repräsentation, der sich aus der lernenden Inter- 
aktion des Menschen mit seiner Umwelt ergibt. Dieses Problem schlägt 
sich in einem äußerst verwirrenden Sprachgebrauch nieder, der noch 
dadurch potenziert wird, dass viele dieser Konzepte in anderen Sprachen 
entworfen wurden. Da es in dieser Situation schon beinahe beliebig ist, 
welche Begrifflichkeit einleuchtend erscheint, schließe ich mich Jaeger 
(1994: 130) an, der zwischen externer und interner Referenz unterscheidet, 
weil mir diese Begriffe als genügend scharf und gleichzeitig anschaulich 
erscheinen. Mit externer Referenz wird somit die Relation zwischen men- 
taler Repräsentation und dem Gegenstand - auch im abstrakten Sinne 
einer Idee - bezeichnet, während interne Referenz den Bezug auf die sinn- 
liche Erfahrung mit diesem Gegenstand meint. «Wenn ein Mensch sich 
Rot vorstellt, muss ein Erfahrungswert von Röte vorhanden sein» (Jaeger 
1994: 129)."4 

Die affektiven Qualitäten, die ein wichtiger Aspekt des Mehrwerts 
sind, entstehen dadurch, dass der Rezipient die jeweils eigene interne 
Referenz in die assoziative Integration von Ion und Bild einbringt. Spe- 


13 «Intelligence implies that an agent can perceive objects hitherto unknown, or perceive 
known objects in new circumstances where the effective sensor signal deviates from 
earlier occurrences.» 

14 «When a human thinks red, there must be an experience of redness involved.» 
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ziell die sensorischen Qualitäten appellieren an diesen Gefühlswert. Um 
diesen komplexen Sachverhalt zu verdeutlichen, sei noch einmal das Bei- 
spiel Laserschwert aufgeboten. Der intendierte affektive Gehalt dieses 
Objekts kann unter anderem mit dem Ausdruck Gefährlichkeit beschrieben 
werden. Der Bedeutungsaufbau entfaltet sich dynamisch, indem mehrere 
Hinweise auf die Gefährlichkeit einander folgen: zuerst über die sprachli- 
che Exposition, danach über die Funktionsaufnahme, die mit dem Zischen 
eine sensorische Qualität vermittelt. Das Zischen appelliert an Erfahrun- 
gen von Schnelligkeit im Waffengebrauch, indem es klanglich die poten- 
zierte Form eines Windgeräuschs darstellt, verursacht durch schnelle 
Bewegung von Pfeilen oder Schwertern in der Luft. Inder Überhöhung der 
dynamischen Qualität durch die Klanglichkeit und die Lautstärke unter- 
scheidet es sich an Kraft und Stärke von diesen traditionellen Vorläufern 
und etabliert damit eine Differenz. Das Gefühl von Geschwindigkeit wird 
weiter ausgebaut durch das Phasing. Die Gefährlichkeit resultiert zu die- 
sem Zeitpunkt aus den Merkmalen potent und schnell. Im ersten Kampf 
kommt die konkrete Funktion dazu. Die Aspekte Potenz und Geschwindig- 
keit werden visualisiert über die Reaktionen der Figuren. Das punktuell 
präsente Brutzeln bei den Berührungen generiert eine weitere sensorische 
Qualität, indem eine Ähnlichkeit zu Verbrennungen an elektrischen Lei- 
tungen oder Kochplatten hergestellt wird. Der Rezipient stellt nun wahr- 
scheinlich die Hypothese auf, dass das Laserschwert zu Verletzungen 
durch große Hitze führt. Der abgetrennte Arm bestätigt diese Hypothese 
visuell zumindest teilweise. Ein Gefühl von Unsicherheit über die tatsäch- 
liche Wirkungsweise bleibt jedoch bestehen und wird auch später nicht 
abgebaut. 

Zwischen der redundanten Interaktion im Beispiel Pferdegetrappel 
und der komplexen Interaktion im Beispiel Laserschwert ist ein kontinu- 
ierlicher Übergang denkbar, der sich aus den Dimensionen Ähnlichkeit 
und Differenz zusammensetzt. Die Redundanz ist eine Folge der maxima- 
len Ähnlichkeit zwischen den Konzepten mit dem Mehrwert Null. Am 
anderen Ende der Skala befindet sich die maximale Differenz, ebenfalls 
mit dem Mehrwert Null. Denn wenn die Konzepte nichts mehr miteinan- 
der zu tun haben, können sie nicht mehr in einen Zusammenhang gebracht 
werden, sondern erzeugen Chaos. Der von Eisenstein, Clair und anderen 
geforderte Kontrapunkt ist deshalb so selten und hat sich im Mainstream- 
film als Strategie nicht durchgesetzt, weil er sich an diesem riskanten Ende 
der Skala befindet. Auf der Skala zwischen maximaler Redundanz durch 
völlige Übereinstimmung und Chaos bei maximaler Differenz scheint der 
Mehrwert dann am größten, wenn ein reichliches Maß von Verrätselung 
besteht. 
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Goschke/Koppelberg (1993: 93) erklaren die Kombination von Kon- 
zepten zu komplexen Bedeutungen als Erfiillung multipler Randbedingun- 
gen (multiple constraint satisfaction). Randbedingungen sind in diesem 
Modell Konnektionen zwischen Einheiten. 


Betrachten wir zum Beispiel eine stark hemmende Verbindung zwischen 
zwei Einheiten, von denen die eine ein Indikator fiir das Merkmal RUND ist, 
wahrend die andere ftir das Merkmal QUADRATISCH steht. Diese Verbin- 
dung verkörpert die Randbedingung, dass wenn eine der beiden Einheiten 
aktiv ist (d.h. wenn einem Objekt das Attribut rund zugeschrieben wird), die 
andere Einheit inaktiv sein sollte (d.h. das Netzwerk nimmt an, dass Dinge 
nicht zugleich rund und quadratisch sein können). Ist eine der beiden Einhei- 
ten «an» und die andere «aus», so ist die Randbedingung erfüllt. [...] Je mehr 
Randbedingungen erfüllt sind, umso geringer ist die Energie des Netzwerks. 
[...] Es ist gezeigt worden (Hopfield 1982), dass Netzwerke unter gewissen 
Voraussetzungen dazu neigen, diese Energiefunktion zu minimieren. [...] Ein 
solcher Zustand, auf den das Netz bei einem gegebenen Eingabemuster kon- 
vergiert, kann als maximal kohärente «Interpretation» des Eingabemusters 
betrachtet werden. (Goschke/Koppelberg 1993: 93 f.) 


Dieses Modell veranschaulicht, warum nicht alle denkbaren Kombina- 
tionen möglich sind, sondern ein gewisses Maß an Übereinstimmung 
gewährleistet sein sollte. Solange sich jedoch die Merkmale nicht völ- 
lig ausschließen, können sie vom System, in diesem Fall dem Wahrneh- 
mungssystem, verarbeitet werden. Zudem wird von Goschke/Koppel- 
berg eine allgemeine Tendenz des kognitiven Systems zur Herstellung von 
Gleichgewicht und Kohärenz anschaulich erklärt. 

Ausnahmen sind Dissoziationen, die durch den narrativen Kontext 
erklärt werden, unter anderem einige Formen von Subjektivierungen 
(> 395). Solche Dissoziationen simulieren Wahrnehmungsverschiebun- 
gen aus der Sicht der Figuren: Träume, Erinnerungen, emotionale Grenz- 
erfahrungen, Halluzinationen, Drogenkonsum. Solche Zustände können 
sich auch im wirklichen Leben in einem Auseinanderklaffen von Informa- 
tionen aus den verschiedenen Modalitäten äußern. 

Besonders im Animationsfilm wird deutlich, dass die Differenzen 
außerordentlich großsein können, so lange die Minimalanforderung einer 
minutiösen zeitlichen Koinzidenz gegeben ist. Eine weitere Möglichkeit, 
ausgeprägte Differenzen zwischen Ion und Bild zu integrieren, kann die 
räumliche oder situative Kohärenz sein. Sie schafft eine Form der Plau- 
sibilitätsbeziehung, die auf der empirisch verankerten Wahrscheinlich- 
keit beruht, dass die gehörten und gesehenen Objekte in der dargestellten 


150 Ton/Bild 


Situation zusammen vorkommen können. Mit diesem Komplex, der für 
die Konstruktion des filmischen Raums eine große Rolle spielt, werde ich 
mich im Kapitel Orientierung, Setting, Szenografie (> 298) detailliert ausei- 
nandersetzen. 


Tonperspektive 


Zur Herstellung der Illusion, dass die sichtbare Welt des Films auf der 
Leinwand und die hörbare Welt des Films aus dem Lautsprecher eins sind, 
gehört die sorgfältige Koordination der akustischen und optischen Raum- 
parameter, der Bild- und Tonperspektive. Unter Tonperspektive versteht 
man in der monophonischen Repräsentation die Staffelung der Klangob- 
jekte zwischen Vorder- und Hintergrund. 

In der Frühzeit des Tonfilms drehte man mit mehreren Kameras 
gleichzeitig. Diese Praxis verhinderte die Gestaltung einer exakten Ton- 
perspektive. Wenn nämlich mehrere Kameras verschiedene Einstellungs- 
größen und Blickwinkel aufnehmen, entstehen zwei Probleme: Einerseits 
fehlt eine eindeutige optische Bezugsperspektive, andererseits verbie- 
tet der Wunsch nach der Maskierung des Aufnahmeapparats, dass das 
Mikrofon im Bild sichtbar wird. «Mikrofone wurden an der Decke aufge- 
hängt oder hinter Blumenvasen, Vorhängen oder unter Tischen versteckt» 
(Stewart 1980: 43).15 Wenn Mikrofone starr installiert werden müssen, 
kann man die Bewegungen der Schauspieler nicht ausgleichen. Dadurch 
kommen unmotivierte Entfernungsänderungen zustande, die keine Ent- 
sprechung im Bild haben. Zudem waren die ersten Kondensatormikro- 
fone schwer und unhandlich; den Mikrofongalgen, mit dem das Mikrofon 
mobil den Bewegungen der Schauspieler folgen kann, erfand die Tonabtei- 
lung von MGM unter Leitung von Douglas Shearer 1929. Als der Galgen 
die Mikrofone aus ihren statischen Verstecken befreite, als wagemutige 
Regisseure und Kameraleute den Kamerabungalow auf Räder stellten und 
durch das Dekor fuhren, als Schnitt- und Mischtechnik so weit entwickelt 
waren, dass man Bild und Ton beliebig miteinander kombinieren konnte, 
setzte die Diskussion um die Tonperspektive ein. Das war bereits 1929, als 
Rouben Mamoulian APPLAUSE und King Vidor HALLELUJAH! drehte. 

Analog zur monokularen Bildperspektive dachte man zunächst 
daran, eine räumliche Hierarchie zu schaffen. Dabei kam das einfache 
Gesetz zur Anwendung, nach dem die Distanz des Objekts zur Kamera der 


15 «Microphones were suspended from above or hidden behind flower vases, underneath 
tables, or in back of curtains.» 
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Distanz des Objekts zum Mikrofon entsprechen sollte. Anders ausgedrückt: 
Je näher sich eine Figur oder ein klingender Gegenstand bei der Kamera 
befindet, desto näher muss auch das Mikrofon platziert sein. Unter dem 
Titel The Illusion of Reality in Sound Pictures befasst sich der Chefingenieur 
von MGM, Wesley C. Miller, mit den Fallstricken der Tonperspektive. 


Wenn ein großer Teil der Geschichte durch den gesprochenen Dialog ver- 
mittelt wird, ist es unumgänglich, Stille zu wahren und jedem Wort volle 
Aufmerksamkeit zu schenken. [...] Der Mensch, der über zwei Ohren und ein 
Gehirn verfügt, hat damit die Möglichkeit, die gewünschten Töne herauszu- 
sortieren und automatisch wahrzunehmen, ob ein Ton zuerst das eine oder 
andere Ohr erreicht. [...] Wir mögen es ungern öffentlich zugeben, aber es 
scheint zu stimmen, das diejenigen Filmgeräusche am natürlichsten klingen, 
die das Ergebnis von intelligenten und durchdachten Kunstgriffen sind. 
[...] Deshalb müssen wir in Aufnahme und Wiedergabe eine Illusion des 
normalen Hörens schaffen. [...] Offenbar hilft es, diese Zwei-Ohr-Illusion zu 
erzeugen, wenn wir die Perspektive nicht nur erhalten, sondern sogar etwas 
überbetonen.'° (Miller 1931: 211 ff.) 


Millers Uberlegungen ruhen auf einem durchdachten psychophysischen 
Fundament. Es ist ihm bewusst, dass die Anordnung der Klangobjekte auf 
einer starren Achse ein wesentliches Element zur Orientierung in komple- 
xen Tongemischen eliminiert, nämlich die Verrechnung von interauralen 
Zeitdifferenzen (> Auditive Ortung 41). Um diesen Verlust auszugleichen, 
muss das Unterscheidungsmerkmal der Entfernung überproportional- 
betont werden. Das bedeutet, dass die Klangelemente im Wesentlichen 
auf einen klar herausgearbeiteten Vordergrund und einen Hintergrund, 
der sich ebenso deutlich vom Vordergrund unterscheidet, verteilt werden 
müssen. Überdies wird auf der Basis dieser Überlegungen klar, dass die 
Klangobjekte auch zeitlich möglichst auseinander sortiert werden müssen, 
um den natürlichen Selektionsmechanismus zu simulieren. Nicht nur die 
monofonische Aufzeichnung, sondern auch die geringe Auflösung (> 34) 


16 «If much of the story is told by the spoken dialogue, it becomes practically imperative 
to maintain silence and to pay strict attention to every word. [...] Human beings with 
their two ears and brain have the faculty of sorting out the sounds which they want 
to hear and of automatically sensing the small time difference between sounds strik- 
ing first one ear and then the other. [...] We perhaps dislike admitting it in public, but 
it seems to be a fact that the most natural appearing results obtained in this business 
are quite apt to be the result of intelligent and studied artifices. [...] We must then plan 
in recording and reproduction an illusion of normal hearing. [...] Manifestly, if we can 
maintain, and even to some extent exaggerate, the perspective of our sound we can 
help to get this two-eared illusion.» 
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des frühen Lichttons behinderte den Aufbau einer idealen, natürlichen 
Repräsentation der räumlichen Eigenschaften des Tons. Differenzierte 
räumliche Nuancen gingen im allgemeinen Rauschen unter. Darüber 
hinaus waren die standardisierten akustischen Bedingungen in den künst- 
lichen Dekors der Studios weit davon entfernt, fein variierte, vielfältige 
Raumeigenschaften zu produzieren. 

Miller nimmt in seinem Statement eine Mittelstellung zwischen zwei 
Schulen ein, die bis heute Bestand haben. Die eine Schule, vertreten durch 
den standardisierten Hollywoodfilm seit Mitte der 1930er-Jahre, stellt den 
Primat der Sprachverständlichkeit um den Preis fast vollständiger Nega- 
tion der räumlichen Eigenschaften in den Vordergrund. Schon 1933 hatte 
Arnheim diese Praxis kritisiert und darauf hingewiesen, dass der Dialog 
auf diese Weise die menschliche Figur aus dem gegenständlichen Umfeld 
der Objekte herauslöst und sie privilegiert. Tatsächlich hatte die Sprach- 
verständlichkeit damals wie heute in der Mehrheit der Mainstreamfilme 
absolute Priorität, nicht nur aus ideologischen Gründen, wie beispiels- 
weise Doane 1980 meint, sondern auch aus Gründen der phylogeneti- 
schen Entwicklung des Ohrs entlang der Sprachproduktion. Im Dialog 
des Mainstreamfilms soll Sprache hauptsächlich ihren kommunikativen 
Zweck erfüllen und erst in zweiter Linie als Klang wirken. 

Die zweite Schule, praktiziert von einigen Pionieren in der Phase des 
Übergangs zwischen 1929 und 1933, setzt auf eine realistisch wirkende 
Betonung der klanglichen Raumeigenschaften und nutzt eine Gefähr- 
dung der Sprachverständlichkeit bis hin zur völligen Maskierung, um 
das erzählerische Arsenal zu erweitern. Diese Auflösung der hierarchi- 
schen Platzierung der Klangobjekte wurde in den späten 1950er-, den 
1960er- und 1970er-Jahren im europäischen Kunstfilm und dort besonders 
im französischen Kino der Nouvelle vague als Ausdruck der rebellischen 
Opposition gegen die erdrückenden Standards erneut praktiziert. Die 
simultane Darbietung verschiedenster Klangobjekte, die Unterwanderung 
des Primats der Sprachverständlichkeit, sollten die Wahrnehmung des 
Zuschauers aufrauen. Die Weigerung, mit der strukturierten Aufbereitung 
des akustischen Materials eine perzeptive Vorarbeit zu leisten, sollte ihn 
vom passiven Konsum weg zu aktivem Suchen hinführen. Die Intention 
ist in einem solch komplexen Klangmuster nicht mehr in derselben zwin- 
genden Weise eingeschrieben wie in den hierarchisch durchstrukturierten 
Tonspuren des standardisierten Mainstreamfilms. 

Nur wenige Filme aus der Frühphase des New Hollywood gingen so 
weit, die Sprachverständlichkeit der komplexen Schichtung verschiedener 
Klangobjekte zu opfern: THE Exorcist (USA 1973, William Friedkin), Jaws 
(USA 1975, Steven Spielberg) und ALL THE PRESIDENT’S MEN (USA 1976, 
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Alan J. Pakula). Die Verletzung der Norm steht hier jedoch unter einem 
anderen Vorzeichen als in der europäischen Filmproduktion: Sie wird 
zur gezielten Informationsverweigerung funktionalisiert und somit der 
Intention oder dem narrativen Fluss der Informationsdistribution unter- 
geordnet. Mit anderen Worten: Man lässt den Zuschauer in einer solchen 
Konstruktion der Tonperspektive nicht frei laufen, um ein wildes Klang- 
universum nach eigenem Gusto zu durchstreifen, sondern nimmt ihn viel- 
mehr an eine straffere Leine, um ihn daran zu hindern, Geheimnisse zu 
erkunden, die ihm vorenthalten werden sollen. Die Information wird ihm 
zur planvollen Spannungssteigerung und nicht aus Gründen der ideologi- 
schen Aufmischung von Figur und Grund verweigert. 

Mit der Einführung des Stereotons konnten die Klangelemente aus 
der starren Achse des Monotons gelöst werden. Damit entfiel die Notwen- 
digkeit, Vorder- und Hintergrund klar voneinander zu trennen, weil nun 
die Raumparameter zur mentalen Ausgliederung der einzelnen Klangob- 
jekte zur Verfügung standen. Eine vielgestaltige Schichtung mit subtilen 
Raumnuancen rückte in den Bereich des Möglichen, fein abgestufte akus- 
tische Rauminformationen eroberten Ende der 1970er-Jahre das verlorene 
Terrain der Tonperspektive zurück. Sergi (1998: 160) hat dafür ein schö- 
nes Bild gefunden: «Die Einführung von Stereo öffnete neue Tiiren[...] im 
Kinosaal.»' 


Extension 


Für die Erweiterung des Klangraums auf 360° im Kino verwende ich einen 
Begriff, den Chion (1990: 77) eingeführt hat, in leichter Abweichung von 
seiner ursprünglichen Bedeutung: den Begriff der Extension. Chion hat 
diesen Begriff vor allem zur Beschreibung der Ausdehnung von Atmo- 
sphären geschaffen (> 306). Da es jedoch im zeitgenössischen Film nicht 
nur die Atmosphären, sondern auch diverse andere Klangobjekte mit 
unterschiedlichen semantischen Funktionen sind, welche sich über den 
Bildraum hinaus in alle Quadranten des Kinos verlagern, scheint mir eine 
solche leichte Veränderung des Begriffs gerechtfertigt. 

Die Extension kann sich in einem einzelnen Film ändern, das heißt, je 
nach Situation kann ein größerer oder kleinerer akustischer Raum über die 
Klangobjekte exponiert werden. Mehr noch, jedes einzelne Klangobjekt 
hat nicht nur eine bestimmte Position, die stabil bleiben oder sich ändern 


17 «The introduction of stereophonic technology meant the opening of new doors to the 
[...] auditorium|[...].» 
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kann, sondern auch eine Extension, die stabil bleiben oder sich ändern 
kann. Es kann punktförmig sein, zum Beispiel ein Faustschlag in akustisch 
trockener Umgebung, oder es kann sehr ausgedehnt sein, zum Beispiel 
ein Verkehrsrauschen. Im Verbund organisieren die diversen Klangobjekte 
eine übergeordnete Gesamtextension. 

Das Konzept der Extension beschreibt am sinnfälligsten die komplexe 
räumliche Klangarchitektur, in der jedes Klangobjekt nicht nur seinen Ort 
hat, sondern auch seine spezifischen Raumcharakteristika aufweist. 

Bildraum und Tonraum treten über die Extension in einen Dialog, der 
abstrakt in folgende Muster eingeteilt werden kann: 


a) Bildraum und Tonraum entsprechen einander 
b) das Bild suggeriert Weite, die Töne haben eine trockene Studiopräsenz 
c) das Bild ist ausschnitthaft, die Tonspur verdeutlicht den Raum 


Zunehmend gehört die Mehrzahl aller Szenen zum letztgenannten Mus- 
ter. Die Entgrenzung der Leinwand - wie man dieses Phänomen auch 
bezeichnen könnte - wird aus Apparatus-theoretischer Sicht kritisch dis- 
kutiert. Je mehr die Klangobjekte die Grenzen des Bildrands überschrei- 
ten, desto deutlicher wird die Künstlichkeit dieser Grenze. «Eine kriti- 
sche Zone aber ist der Bildrand noch aus einem zweiten Grund: Entlang 
der <framelines> stoßen Bildraum und Zuschauerraum, <objectfield> und 
<subjectfield> zusammen» (Winkler 1992: 42). Diese Grenze überwinden 
die Töne wieder, gerade durch ihre Allgegenwärtigkeit. Auf der Ebene 
des Mediums wirken sie als suturing device, als ein Mittel, die materielle 
Heterogenität und die Fragmentierung des Bildes zu überbrücken und die 
Wunde zusammenzunähen, welche dieser Fragmentierung zugeschrieben 
wird. 

Die Integration verschiedener Raumrepräsentationen der auditiven 
und visuellen Modalität gehört zur Basisstrategie der intermodalen Inte- 
gration verschiedener Sinnesdaten, auch im Alltag. Diese Daten können 
sich unterschiedlich zueinander verhalten. Wie ich mit Piaget dargestellt 
habe (> 110), bildet sich beim Kleinkind die sogenannte Objektperma- 
nenz aus. Das Kind beginnt zu verstehen, dass die Objekte auch außerhalb 
ihrer aktuellen Repräsentation weiter existieren können, dass die wahrge- 
nommene Welt nur ein Fragment einer ausgedehnteren Wirklichkeit dar- 
stellt. 

Wenn ich mit starrem Blick auf meinen Laptop am Schreibtisch sitze, 
so sind verschiedene Kreise des Raums in verschiedener Extension immer 
präsent, unabhängig von der Relevanz, die sie für mich besitzen. Wenn 
diese Relevanz sich ändert, wenn plötzlich ein lauter Knall ein mehrheit- 
lich homogenes Klangfeld zerreißst, dann wird sich die Aufmerksamkeit 


Extension 155 


aus dem engen Bezirk des Laptops, der von Ton und Bild gemeinsam 
repräsentiert wird, wegbewegen. Es findet kurzfristig eine Dissoziation 
von auditivem und visuellem Modus statt. Im lebensweltlichen Alltag 
wird man diese kognitive und sensorische Dissonanz aktiv abzubauen 
versuchen, entweder indem man der Ursache der akustischen Störung 
nachgeht oder indem man beschließt, sie zu ignorieren. Aufjeden Fall wird 
zunächst eine reflexhafte Orientierungsreaktion stattfinden. Während der 
Filmrezeption lenken Geräusche den Blick, sie führen in die Tiefen des 
Raums oder in jene Bereiche, die nicht oder noch nicht sichtbar sind; sie 
bewirken eine aktive Suchbewegung, die Spannung erzeugt, solange sie 
als kognitive Dissonanz bestehen bleibt. Je nach Situation wird die Kame- 
raführung diese Dissonanz auflösen, entweder indem sie über eine Kame- 
rabewegung die Suchstrategie simuliert, oder in dem im Umschnitt die 
Quelle des Geräuschs zu sehen ist. Die intermodale Assoziation ist nicht 
nur für die Objektkonstruktion, sondern auch für die Raumkonstruktion 
eine notwendige Voraussetzung. 

Ein sehr schönes Beispiel für eine plastische Extension, die sich stän- 
dig ändert, ist die Ankunftsszene aus THE Prano (Neuseeland 1992, Jane 
Campion, 0.03.43-0.08.02). 


Phase: Zeit 


Bild 


Ton 


1: 0.00.00-0.00.07 


Unterwasser, Boot 
halbtotal von unten 


Blubbern unter Wasser mit weiter Ex- 
tension 


2: 0.00.07-0.00.30 


Flora und Adanah auf 
Boot 


Gestaffelte Extension: Ächzen hölzern 
des Ruders nah; Stimmen aufgeregt 
weiter entfernt; Meeresbrandung 
tosend von ganz nah bis ganz weit 


3: 0.00.30-0.00.55 


Totale Meeresbran- 
dung mit Boot 


Stimmen aufgeregt weiter entfernt, 
Meeresbrandung und Wind mit extre- 
mer Extension (Surround) 


4: 0.00.55-0.01.10 


Establishing Shot 
Küste 


Möwen, Wind und Brandung mit 
weiter Extension 


5: 0.01.10-0.01.33 


Personen halbtotal 
bis nah 


Extension gestaffelt: Schritte im Sand, 
Erbrechen, Pinkeln, Gelächter, Grölen 
mit kleiner Extension präsent; Meeres- 
brandung extrem im Hintergrund 


6: 0.01.33-0.01.43 


Detail Füße in Bran- 
dung, Großaufnahme 
Ada 


Extension gestaffelt: Wellen nah plät- 
schernd, Grölen entfernt, Möwen mit 
weiter Extension 


7: 0.01.43-0.02.03 


Strand total 


Extension von weit bis eng: Wind an- 
schwellend 
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Phase: Zeit 


Bild 


Ton 


8: 0.02.03-0.03.00 


Männer, Ada und 
Flora nah 


Extension gestaffelt: Stimmen nah, 
Schritte nah, Wind und Brandung 
entfernt mit weiter Extension, Grölen 
und Gelächter im Hintergrund mit be- 
grenzter Extension 


9: 0.03.00-0.03.10 


Strand total 


Wind anschwellend mit Extension von 
weit bis eng 


10: 0.03.10-0.03.25 


Brandung nah 


Extension gestaffelt: Brandung tosend 
extrem Stereo, Möwen entfernt mit 
weiter Extension 


11:0.03.25-0.03.30 


Ada und Flora allein, 
halbtotal 


Wind sausend entfernt mit kleiner 
Extension 


12: 0.03.30-0.03.59 


Ada Detail: Hände am 
Klavier 


Holz wegschieben, Klaviertasten kla- 
ckend sehr nah mit kleiner Extension, 


Wind im Hintergrund verschwindet, 
Klaviermusik nah setzt ein, isoliert 


13: 0.03.59-0.04.20 | Klavier in Brandung Meeresbrandung bricht rauschend 


herein, präsent mit kleiner Extension 


Versucht man, diese Vielfalt von Bild- und Tonrelationen unter dem 
Gesichtspunkt der Extension zu systematisieren, werden folgende Muster 
erkennbar: 

Zunächst ist das Bild während Phase 1 und 2 ausschnitthaft, während 
die Tonspur mit weiter Extension den Horizont öffnet. Danach wird der 
Schauplatz auch im Bild über totale Einstellungen etabliert, die der Orien- 
tierung dienen; während Phase 3 und 4 entsprechen Bild- und Tonraum 
einander. Die gestaffelte Extension in den Phasen 5 und 6, in der die Klang- 
objekte in unterschiedlicher Nähe und Extension parallel angeordnet sind, 
führt beide Stränge weiter; teilweise entsprechen die Klangobjekte der 
visuellen Repräsentation ihrer Quelle, teilweise vertreten sie ein weiteres 
räumliches Umfeld. Ab Phase 7 leitet die Tonspur eine Verengung ein, die 
ab Phase 10 auch von der Bildgestaltung aufgenommen wird; diese Veren- 
gung entspricht einer zunehmenden Konzentration auf die Protagonistin 
und ihr Klavier. 

Als einziges der drei oben erwähnten Grundmuster (> 154) kommt 
Version b (das Bild suggeriert Weite, die Töne haben eine trockene Stu- 
diopräsenz) nicht vor. Mehrheitlich ist die Umwelt auf der Tonspur prä- 
senter als in den Bildeinstellungen. Die Elemente Wind, Meer und Möwen 
charakterisieren eine wilde, ausgedehnte Natur, in der das Individuum 
klein erscheint. Die zunehmende Konzentration und Verengung gegen 
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Ende der Szene drücken den inneren Rückzug Adas in ihre eigene Welt 
aus. 

Die Veränderungen der Extension auf der Tonspur entsprechen nicht 
einfach der Bildgestaltung. Sie sprengen den Rahmen einer rigiden Raum- 
logik, die einfachen perspektivischen Gesetzen gehorcht, und sind eigen- 
ständige narrative Manifestationen zur Beschreibung eines Orts und der 
Befindlichkeit einer Figur, deren Funktionsweisen ich unter den Aspekten 
Orientierung (> 314) und Subjektivierung (> 362) erklären werde." 


18 In Bezug auf die Platzierung von Klangobjekten im Raum besteht insbesondere seit der 
Einführung der digitalen Formate unter den Sound Designern ein erheblicher Dissens, 
wie der Filmtonmeister Dieter Lengacher richtig anmerkt. Weitere gezielte Studien in 
diesem Bereich sind notwendig. 


5 Semantik höherer Ordnung 


Bedeutungen höherer Ordnung entstehen dann, wenn ein weiterer Kon- 
text die einfache Bedeutung eines Klangobjekts anreichert. Dazu zählen 
Formen der Bedeutungsmodifikation durch eine gesellschaftliche Über- 
einkunft wie die Signale, die eine im Alltag fest verankerte kommunika- 
tive Funktion haben. Weiter sind es Formen der Bedeutungszuschreibung 
durch den symbolischen Gehalt der Quelle, die über die Einbindung in 
religiöse oder rituelle Praktiken oder durch ihren mythischen Hinter- 
grund geschaffen werden. Nicht zuletzt aber sind es auch gattungsspe- 
zifische Erscheinungen, die durch intertextuelle Wiederholungen aufge- 
baut werden, speziell Stereotype. Innerhalb der filmischen Werke selbst 
können durch die strukturelle Anordnung ebenfalls Bedeutungen höhe- 
rer Ordnung, sogenannte Superzeichen, gebildet werden; ein bekanntes 
Phänomen für diese Form der Bedeutungsveränderung ist das Leitmotiv, 
das bereits in der dramatischen Musik des 19. Jahrhunderts eine Rolle 
spielte. 

Eine spezifische Eigenschaft dieser Erscheinungen ist ihre «Ver- 
schlungenheit»: Signale werden zu Symbolen, Symbole und Stereotype zu 
Leitmotiven oder Signale zu Stereotype. 

Barthes (1957) hat sich im Hinblick auf moderne Mythen mit dieser 
Form der gesellschaftlich definierten Bedeutungsveränderung befasst und 
dort einen ähnlich dynamischen Prozess festgestellt, der im Prinzip gren- 
zenlos ist. Alles kann zum Mythos werden, wenn ein gesellschaftlicher 
Gebrauch zur reinen Materie hinzutritt (1957: 194). Bedeutungsverände- 
rungen höherer Ordnung sind deshalb immer historisch und kulturell 
verankert. Sie entstehen und verschwinden, ohne dass ihre Lebensdauer 
von der Natur der Sache geprägt würde. Am Beispiel des Rosenstraußes 
als Ausdruck der Leidenschaft veranschaulicht Barthes (1957: 197 f.), dass 
sich die Bedeutung weder aus den Rosen noch aus der Leidenschaft ergibt, 
sondern als etwas Drittes eine Relation bezeichnet, die zwischen beiden 
entsteht. Solche Relationen stehen im Fokus der folgenden Überlegungen 
zum Gebrauch kulturell verankerter Bedeutungsveränderungen auf der 
Tonspur. 
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Signale 


Klangobjekte, die einen gesellschaftlich definierten kommunikativen Gehalt 
haben, heißen umgangssprachlich Signale.' Der kommunikative Gehalt von 
Signalen ist im Allgemeinen eine Handlungsaufforderung, die häufig mit 
einem Warnhinweis verbunden ist. Klanglich haben die meisten Signale 
eine sehr einfache Gestalt. Meist bestehen sie nur aus einem oder zwei 
Sinustönen — Tönen mit nur einer Frequenz -, oder sie sind harmonisch 
strukturiert. Entsprechend ihrer warnenden oder hinweisenden Funktion 
sind sie so konzipiert, dass sie auffallen. Ihre Grundfrequenz ist deshalb im 
Bereich zwischen 1 und 2kHz angesiedelt, einem Frequenzbereich, auf den 
das Ohr besonders sensibel reagiert (> Frequenzwahrnehmung 199). 

In einer Untersuchung von Kuwano et al. (1997) wurde die Wir- 
kung von Signalen bei japanischen und deutschen Probanden mithilfe 
des semantischen Differenzials empirisch überprüft. Es zeigte sich eine 
deutliche interkulturelle Übereinstimmung zwischen den Vergleichsgrup- 
pen, welche die Signale als laut, schrill, erschreckend, unangenehm, gefähr- 
lich, hart, aufregend, widerwärtig und stark bezeichneten. Die Interpretation 
unterschied sich lediglich bezüglich des Klangobjekts Glocken, das von 
den deutschen im Gegensatz zu den japanischen Probanden als ange- 
nehm und nicht beängstigend interpretiert wurde. Sie assoziierten mit den 
Glocken eine Kirche, während die Japaner Glocken als Zeichen für Bahn- 
übergänge oder Feueralarm verstehen (Kuwano et al. 1997: 125). Dieser 
Befund stützt die These, dass der kulturelle und soziale Kontext sich lang- 
fristig in die Bedeutungskonstitution eines Klangobjekts einschreibt und 
die Rezeption unabhängig von der klanglichen Gestalt bestimmen kann. 
Die Glocken unterscheiden sich allerdings deutlich von anderen Signalen, 
indem sie über eine reichhaltige pseudoharmonische Form verfügen, die 
im Abschnitt Klangfarbe genauer dargestellt wird (> 203). 

Historisch gesehen sind Signale auf das Wachstum sozialer Ver- 
bände zurückzuführen. Die frühen Siedlungsformen waren auf die Reich- 
weite der menschlichen Stimme zugeschnitten. Obwohl eine europäische 
Stadt in der Größe Wiens noch im 18. Jahrhundert so ruhig war, dass die 
Stimme des Wächters auf dem Stephansdom ausreichte, um Gefahren zu 
melden (Schafer 1977: 166), wurden schon früher andere Systeme einge- 
führt, die größere Entfernungen überbrückten, wie Gongs, Hörner oder 
Glocken, welche auch andere kommunikative Aufgaben übernahmen, 


1 Im Unterschied zur Verwendung des Ausdrucks in der Physik, wo jedes Schallereignis 
als Signal bezeichnet wird. 
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als vor Gefahren zu warnen. Hammerstein (1986: 59f.) hat in zahlreichen 
antiken Quellen aus dem griechischen und arabischen Raum Hinweise 
auf die kommunikative Funktion von Klangobjekten gefunden, die von 
Instrumenten erzeugt wurden. Die griechische Wasserorgel Hydraulis 
oder Organon, eine Frühversion der späteren Kirchenorgel, wurde nicht 
nur bei kultischen Ritualen, sondern auch zur Kommunikation über weite 
Distanzen eingesetzt. In mehreren Schriften wird eine Reichweite dieser 
Signale von 60 Meilen angegeben, laut Hammerstein eine magische Zahl, 
die einen Grenzwert darstellte, «eine Menge, jenseits derer man aufhört zu 
zählen» (1986: 65). Diese Instrumente hatten wie die Hörner die Funktion, 
mit einem heulenden und pfeifenden Ion zu warnen oder Truppenteile 
zu mobilisieren. Ihr lauter, schauererregender Schall soll gleichzeitig phy- 
sisch und psychisch alarmierend gewirkt haben. Ein bekanntes Beispiel aus 
der Literatur ist das magisch vermenschlichte Horn im mittelalterlichen 
Rolandslied. Das Alphorn war ebenfalls ein Dialoghorn, mit dessen Hilfe 
die Menschen komplexere Botschaften übermitteln konnten. 

Auch Glocken scheinen schon früh bei kultischen Handlungen ein- 
gesetzt worden zu sein, werden jedoch erst ab Ende des 7. Jahrhunderts als 
Kirchenglocken beurkundet und dienten immer noch dem Zweck, die bösen 
Geister zu vertreiben (Schafer 1977: 74, 222). Entsprechend der Stellung, wel- 
che die Kirche im Mittelalter einnahm, regelten Kirchenglocken große Berei- 
che des täglichen Lebens, verkündeten Trauer, Freude, Ruhe oder Unruhe. 

Im 18. und 19. Jahrhundert wurden einige dieser Funktionen den Kir- 
chenglocken wieder entzogen. 


Die Geschichte der Warngeräusche [...] hängt eng mit der Fähigkeit des Men- 
schen, Klang zu bilden und zu gestalten, zusammen. Vor der Jahrhundert- 
wende zogen in New York die Feuerwehrleute die Wagen mit Pumpen und 
Leitern selber, während einer von ihnen rufend und Trompete blasend durch 
das Gedränge vorausrannte. (Neuhaus 1993: 64) 


Auch Ratschen warnten vor Gefahren und Feuersbrünsten. Dann wurde 
in der Mitte des 19. Jahrhunderts die Sirene erfunden, die nicht nur 
gewisse Funktionen der Kirchenglocke ersetzte, sondern auch in der Tra- 
dition des Horns und der Hydraulis stand, die einen ähnlich magischen 
Zweck erfüllten wie die Kirchenglocken. Diese Traditionen hat die Sirene 
aufgenommen und weitergeführt. Sirenenklänge sind auf einer überge- 
ordneten gesellschaftlichen Ebene wirksam, während Klingeln und Glo- 
cken als Tür- oder Telefonklingeln im privaten Bereich Übergänge mar- 
kieren. Hörner haben als Autohupen im Verkehr eine kommunikative 
Funktion übernommen. 
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Hupen, Sirenen, Klingeln, Glocken und viele andere Signale gehören 
zum Repertoire fast jeder Tonspur, unabhängig von der Zeit der Entstehung, 
von Inhalt und Genre. Das Setting Stadt zum Beispiel wurde im frühen Ton- 
film fast ausschließlich durch Hupen und Fahrradklingeln dargestellt. 
Signale sind in frühen Tonspuren deutlich überrepräsentiert: Sie machen ein 
Viertel aller wahrnehmbaren nicht verbalen Klangobjekte des Korpus von 
1929 bis 1933 (> Anhang Diagramme 454) aus. Zwei Faktoren privilegierten 
diese Position: Signale sind nicht nur leicht herzustellen, sondern wegen 
ihrer einfachen Struktur und ihrer festen kommunikativen Bedeutung auch 
unter ungünstigen akustischen Bedingungen leicht identifizierbar. 

Im filmischen Kontext sind Signale nur teilweise als Handlungsauf- 
forderung zu verstehen. In erster Linie sind es Telefon- und Türklingeln, 
welche sich im Fluss der Erzählung direkt an die Figuren richten, sowie 
einige der zahlreichen Alarmsignale - Sirenen und Computer-Beeps -, 
die eine konkrete Gefahrensituation ankünden. Ihre Appellfunktion geht 
nicht nur aus dem Kontext hervor, sondern wird außerdem über die pro- 
minente Platzierung des Signals im Vordergrund unterstützt. 

Sehr viel häufiger jedoch tritt die erste Bedeutung — der Hinweis 
auf eine Quelle, die Objektkonstitution oder der Appell an die Verhal- 
tenssteuerung - hinter eine Bedeutung zweiter Ordnung zurück. Zu den 
Bedeutungen zweiter Ordnung gehören der Hinweis auf ein Setting — die 
Sirene als Hinweis auf die urbane Hektik, das Telefon zur Charakterisie- 
rung von Polizeibüros — oder eine noch allgemeinere Form der affektiven 
Bedeutung als Stress, Gefahr, Bedrohung, Aggression. Kurz: Wenn Signale 
zu hören sind, so häufig mit negativem Beigeschmack. In Expositionen, 
Actionszenen und Showdowns sind sie ein unverzichtbares Mittel zur 
emotionalen Intensivierung, gesteigert durch den hektischen Rhythmus, 
dem sie mit Vorliebe unterworfen werden. Dort wird in erster Linie die 
interne Referenz des Zuschauers aktiviert, eine allgemeine Form der Beun- 
ruhigung, die keinen konkreten Verursacher mehr hat, sondern eher eine 
abstrakte Form der Bedeutungserzeugung darstellt. Die spezifische Kino- 
situation verunmöglicht dem Zuschauer, auf seine alltäglichen Strategien 
zur Spannungsreduktion zurückzugreifen: Weder Quelle noch kontextu- 
elle Ursachen des Signals können eruiert werden. Aus dieser Kluft resul- 
tiert ein Maximum an reiner Emotion. Im zeitgenössischen Mainstream- 
film löst sich der suggestive Appell an die Emotionen mehr und mehr von 
der verifizierbaren Plausibilitätsbeziehung. Sirenen und Alarm-Buzzer 
werden überall dort montiert, wo sie zur dramatischen Entwicklung oder 
zur psychischen Befindlichkeit der Figuren passen. Nur mehr lose wird 
der mimetische Schein gewahrt, die Illusion nämlich, dass die Klangob- 
jekte irgendwo im filmischen Universum einen Ursprung haben. 
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Ein ganzes Netz von Signalen überspannt beispielsweise THE PLAYER 
(USA 1992, Robert Altman). Der Film beginnt mit einer Studioglocke, wel- 
che die Aufforderung Ruhe am Set autoritativ unterstreicht. Studioglocke, 
Klappe, extradiegetische Glocken (die zur Musik zu gehören scheinen) 
und Telefonklingel entwickeln eine genau berechnete rhythmische Tex- 
tur, welche die einzelnen Elemente verknüpft und die Spannung steigert. 
Jedes dieser Signale transportiert die Botschaft Achtung!, und zwar sowohl 
innerhalb der Diegese für die Filmfiguren als auch an die Adresse des 
Zuschauers. Natürlich motivierte Signale, die zur Handlung zu gehören 
scheinen, treten in Beziehung zu deutlich hinzugefügten Elementen. Diese 
Elemente - beispielsweise seltsam verhallte Glocken, die während eines 
Mordes im Parkhaus erklingen — werden dank ihrer Positionierung im 
Raum und ihrer kontextfremden Platzierung als nicht diegetische Klang- 
objekte von einigen Rezipienten sogar als Musik klassifiziert, wie eine 
(nicht standardisierte) Beobachtung unter Studenten ergeben hat. 

Ähnlich gestaltet sich die Häufung von Signalen in THE DEER HUNTER 
(USA 1978, Michael Cimino). Die Exposition (0.01.30-0.07.00) ist in einer 
Stahlgießerei angesiedelt, in der die drei Protagonisten arbeiten, die später 
in die Hölle des Vietnam-Kriegs geschickt werden. Cimino etabliert ihre 
Arbeitswelt als wahren Hexenkessel und spannt thematisch und sinn- 
lich einen Bogen zwischen Pennsylvania und Vietnam. Buzzer regelmäßig, 
Sirene lang gezogen, Sirene, Fabriksirene entfernt, Zugshupe entfernt, Zugshupe 
nah und Glöckchen in allen Variationen ohne identifizierbare Quelle korrelieren 
mit der extremen Lautstärke, in welcher die Äußerungen der Individuen 
versinken. Weiter wird die Signalschiene auf der Bildseite über die Dar- 
stellung des Feuers mit der strategisch wirkungsvollen Farbe Rot ausge- 
baut, die ebenfalls über eine traditionell abgestützte warnende Appell- 
funktion verfügt; ein vorbeifahrender Lastwagen erscheint als Funken 
sprühendes Monster; die Sonne hat einen Hof, was der Protagonist als 
indianisches Omen interpretiert. Mythische und perzeptive Qualitäten 
verschmelzen zu einer suggestiven Synthese unguter Vorahnungen, wel- 
che die anschließende, episch breite Schilderung einer russisch-orthodo- 
xen Hochzeit überdauert. 

Neben Sirenen und Glocken ist das Telefonklingeln ein weiterer 
Typus von Klangobjekten mit hoch entwickelter Bedeutung.” Wer Kinder 
beobachtet, sieht, wie einflussreich die frühe Konditionierung durch das 
Telefonklingeln ist: Bevor sie sprechen können, rennen sie wie magisch 


2 Die überaus vielfältige Aufbereitung von Telefonsituationen im Spielfilm wird bei- 
spielsweise von Debatin/Wulff et al. (1991) unter formalen, narrativen und kommu- 
nikationssoziologischen Gesichtspunkten thematisiert. Ich beschränke mich an dieser 
Stelle auf einige Aspekte des Klingelns. 
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angezogen zum Apparat. Auf diesen erworbenen Automatismus zielt 
das Telefonklingeln hin, wenn es prominent in den Vordergrund montiert 
wird. Es ist daher nicht verwunderlich, dass das klassisch-durchdringende 
Klingeln den dezenteren elektronischen Varianten immer dann vorgezo- 
gen wird, wenn das Telefon mit negativen Botschaften assoziiert werden 
soll. Nirgends wird sein magischer Sog sinnhafter dargestellt als in THE 
Hunt FOR RED OCTOBER (USA 1990, John McTiernan; 0.31.34-0.41.03), 
wo das klingelnde Scheppern eines umfallenden Teeglases nahtlos in ein 
endlos langes Klingeln des Telefons tibergeht, bildlich unterstiitzt durch 
eine rasante Fahrt an Hunderten von Aktenordnern mit der Aufschrift Top 
secret vorbei. 

Paradoxerweise taucht das Telefon als rein akustische Kommunika- 
tion schon im Stummfilm auf mit den Funktionen, die Allgegenwart des 
Gesetzes zu repräsentieren, zum Beispiel in THE Last COMMAND von Josef 
von Sternberg (USA 1928), oder als sogenannte last-minute-rescue bei Grif- 
fith (Kessler in Debatin/ Wulff 1991) die überraschende Wende einzuleiten. 
In Hitchcocks BLACKMAIL sind beide Funktionen vertreten: Das Telefon 
steht sowohl in Beziehung zum schlechten Gewissen der Protagonistin, 
rettet sie jedoch auch als Deus ex Machina in letzter Minute davor, ein 
Geständnis abzulegen. 

In MALCOLM X (USA 1992, Spike Lee) verkörpert es die Allgegen- 
wart einer unsichtbaren Bedrohung. Malcolm X kann zwar das Telefon 
aufhängen, aber das Klingeln wird ihn gleich darauf wieder einholen, es 
vergiftet die Atmosphäre und trifft den Lebensnerv seiner Familie. In einer 
bemerkenswerten Szene (2.43.07-2.49.30), welche den tödlichen Anschlag 
auf ihn vorbereitet, findet eine Assoziation zwischen Revolvern, die von 
Unbekannten geladen werden, und einer laufenden Abhöreinheit — eben- 
falls von nur fragmentiert dargestellten Personen bedient — mit dem Tele- 
fon statt. Waffe und Telefon werden über die Montage symbolisch über- 
höht zum Instrument einer infamen Vernichtungsmaschinerie. 

Und ein weiterer, fest etablierter Bedeutungsgehalt des Telefonklin- 
gelns ist der Hinweis auf einen menschenleeren Schauplatz mit symboli- 
schen Zügen: Wenn niemand mehr das Telefon abnimmt, ist die Kommu- 
nikation abgebrochen, bleibt Hilfe aus. 


Symbole 


Symbole sind in außerfilmischen, mehrheitlich religiösen, mythischen 
oder sozialen Traditionen verankert: religiöse Symbole wie das Kreuz, 
soziale Symbole wie eine bestimmte Kleidung, Symbole in psychoanalyti- 
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scher Tradition wie der Phallus, politische Symbole wie das faschistische 
Hakenkreuz usw. 

In der Semiotik wird der Begriff teilweise gleichgesetzt mit Zeichen 
oder signifiant. Dieser Symbolbegriff wie auch das logische Symbol, das 
eine gedankliche Operation darstellt, unterscheidet sich von dem hier 
verwendeten Symbolbegriff. Arbiträres Zeichen und logische Operation 
sind Bedeutungen erster Ordnung, während Symbole sich auf einer höhe- 
ren Abstraktionsebene bewegen und Bedeutungen zweiter und dritter 
Ordnung darstellen. «Die Bedeutung sprachlicher Zeichen kenne ich, ich 
habe sie gelernt, die Bedeutung von Symbolen muss ich deuten» (Kurz 
1988: 80). 

Symbole haben also keine festgeschriebenen Bedeutungen, son- 
dern benötigen die interpretatorische Anstrengung, um verstanden zu 
werden. Das Symbol steht stellvertretend für ein abstraktes Konzept, 
«es ist ein rätselhaftes, ominöses Zeichen, dessen Bedeutung erraten 
und erschlossen werden muss» (Kurz 1988: 69). Es wird geradezu als 
genuines Merkmal des Symbols angesehen, dass es nicht restlos sprach- 
lich gedeutet werden kann, sondern immer einen unerklärten Rest übrig 
lässt, der sich an das Unbewusste wendet. Symbole sind wie Indizien, 
die im Diskurs auftauchen und durch strategische Platzierung im narra- 
tiven Kontext oder durch Wiederholung eine gewisse Aufmerksamkeits- 
optimierung erfahren. Wenn der Zuschauer in einem Western von Sergio 
Leone, der die Abrechnung mit einem Verräter thematisiert, mitten in der 
Stille einen Hahn dreimal krähen hört, so sind diese Bedingungen hin- 
reichend, um einen symbolorientierten Interpretationsprozess in Gang 
zu setzen. 

Es liegt in der Natur der Sache, dass die Beschäftigung mit Sym- 
bolen an Grenzen stößst. Als konkrete Gefahr droht das Abgleiten in die 
beliebig wirkende Überinterpretation, in welcher jedes Detail als mög- 
licher Hinweis auf eine verborgene Wahrheit taxiert wird. Mainstream- 
filme - im Allgemeinen um universelle Verständlichkeit bemüht — wir- 
ken diesem Wahn entgegen, indem sie entweder auf Symbole verzichten 
oder sie kontextuell so deutlich stützen, dass sich die Interpretations- 
möglichkeiten auf die intendierte Lesart hinbewegen. Außerdem gehört 
es zu den Eigenheiten filmischer Symbolkonstruktion, dass sie aus einer 
Asymmetrie zwischen Bild und Ton entstehen, dass also entweder das 
Bild zu sehen oder der Ton zu hören ist; nur äußerst selten werden beide 
gleichzeitig repräsentiert. Typischerweise ist der Hahn in oben erwähn- 
tem Leone-Western deshalb nur auf der Tonspur montiert. Mit dieser 
Strategie wird eine allzu einfache Zuordnung des Objekts zur Diegese 
verhindert. Der Keim zu einer symbolischen Interpretation besteht dem- 
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nach darin, ein gewisses Maß an Dissonanz zwischen Bild und Ton zu 
erzeugen. 

Das Symbolrepertoire des Mainstreamfilms ist weitläufiger, als man 
annehmen könnte, verteilt sich aber ungleichmäßig auf einzelne Filme. 
Die erste Generation des New Hollywood - Spielberg, Scorsese, Cop- 
pola - sowie Regisseure europäischer Herkunft — Jean Renoir, Fritz Lang, 
David Lean, Sergio Leone - sind als Urheber klar überrepräsentiert. Sym- 
bole in die Strukturbildung der Tonspur einzubeziehen, scheint eine 
Entscheidung des Regisseurs oder Autors zu sein. Wenn Symbole in die 
Tonspur eingearbeitet werden, dann in Werken, in denen auch bildliche 
Symbole vertreten oder die Figuren nicht nur reine Akteure der Hand- 
lung sind, sondern in weitergehender psychologischer Tiefe ausgelotet 
werden. Es sind Filme, die auf verschiedenen Ebenen gelesen werden 
können. Insbesondere die Filme von Steven Spielberg sind in ihrer Ver- 
quickung von schlichter Handlung und symbolischer Vertiefung ähn- 
lich wie Volksmärchen, und es ist nicht nur gewinnbringend, sondern 
macht auch Spaß, nach den überlagerten Bedeutungen zu fahnden. In der 
INDIANA JONES-Trilogie beispielsweise wirft er mit einer solch postmo- 
dernen Unverfrorenheit Symbole aus den verschiedensten Kulturkreisen 
zusammen, dass dem bewanderten Symbolforscher das Blut in den Adern 
stocken muss, wenn er sich nicht dazu entschließen kann, das Ganze als 
Spiel zu begreifen. 

Mit Gewinn unterscheidet Martin (1994: 104) zwischen manifester 
und latenter Bedeutung. Ob ein Zuschauer in der Lage ist, die latente 
Bedeutung zu erfassen, hängt von seinem spezifischen Erfahrungshinter- 
grund, der kulturellen und intellektuellen Bildung, seiner Fantasie und 
Sensibilität ab. Auf der anderen Seite ist eine latente Bedeutung grund- 
sätzlich nur dann verfügbar, wenn sie entweder mit der Tradition korre- 
liert oder innerhalb des Textes sorgfältig aufgebaut wird. Ein Beispiel für 
den ersten Fall sind die Glocken, die von japanischen Probanden gemäß 
Kuwano et al. (1997) völlig anders interpretiert werden als von den euro- 
päischen. Der Mainstreamfilm als interkulturellverfügbares Medium trägt 
diesem Umstand Rechnung, indem Symbole immer nur im Hintergrund 
als fakultative Bedeutungen mitschwingen. Um auf Sergio Leone zurück- 
zukommen: Man versteht den Film auch dann, wenn man nicht durch ein 
biblisches Vorverständnis mit der symbolischen Bedeutung des Hahnen- 
schreis vertraut ist. In anderen Filmen hingegen, die sich als offene Werke 
begreifen, kann der symbolische Gehalt von essenzieller Bedeutung für 
den Verstehensprozess sein. 
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Fallstudie: Glocken 


Symbole werden nicht nur durch den kulturellen, sondern auch durch den 
historischen Kontext modifiziert. Die Symbolik von Glocken hat auf der 
filmischen Tonspur eine geschichtliche Entwicklung durchlaufen, deren 
verschiedene Ausprägungen ich anhand des Korpus (> 461) untersucht 
habe. Im wirklichen Leben sind Glocken Signale, auf der Tonspur sind 
sie - wie wir gleich sehen werden - fast ausschließlich als Symbole zu 
begreifen. Die mythische Qualität der Glocken und ihre Verbindung zur 
Uhr, die das Konzept Vergänglichkeit/Sterblichkeit vertritt, ist sogar das 
vielleicht am häufigsten zitierte Klangsymbol seit Beginn der Tonfilmzeit. 
Typologisch kann man die symbolbildende Funktionsweise des Glocken- 
läutens als Synekdoche verstehen. In der Synekdoche vertritt ein Teil das 
Ganze (Pars pro Toto), in diesem Fall die Glocke als exemplarischer Teil die 
Kirche, die Kirche wiederum als exemplarischer Teil das Christentum als 
übergeordnetes System. 


a) Signalfunktion 


e Feuerwehrglocken in SAN Francisco (USA 1936, W.S. Van Dyke) 

e Als Startzeichen eines Boxkampfs in FROM HERE TO ETERNITY (USA 
1953, Fred Zinnemann) und in Racinc Butt (USA 1980, Martin Scor- 
sese) 

e Warnung vor der Katastrophe in THE HURRICANE (USA 1937, John 
Ford) und EARTHQUAKE (USA 1974, Mark Robson) 

e Warnung vor dem amerikanischen Angriff in APOCALYPSE Now 
(USA 1979, Francis Ford Coppola) 

e Friedensglocken in Lapy HAMILTON (GB 1941, Alexander Korda) 
und Wırson (USA 1944, Henry King) 

° Siegesglocken in THE GREAT Race (USA 1964, Blake Edwards) 

e Hochzeitsglocken in THE HURRICANE (USA 1937, John Ford), THE 
CowBoy AND THE LADY (USA 1938, H.C. Potter) und THE GREAT CA- 
guso (USA 1951, Richard Thorpe) 


Nur die Feuerwehr- und die Boxkampfglocken haben reine Signalfunk- 
tion. Sowohl bei den Hochzeits- als auch den Friedensglocken spielt eine 
religiöse Komponente mit hinein, die mit der Kirche als Ort der Feierlich- 
keiten zusammenhängt. Wirklich bemerkenswert sind in diesem Komplex 
die Hochzeitsglocken in THE HURRICANE. Dieser Film — zusammen mit 
SAN FRANCISCO ein früher Vertreter des Katastrophengenres — baut eine 
eigentliche symbolische Dichotomie zwischen rigider christlicher Moral 
und der freiheitsliebenden, naturnahen Religiosität der Südseeinsulaner 
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auf, die zunehmend eskaliert und sich erst in der kathartischen Katas- 
trophe des Hurrikans wieder auflöst. Die scharfe Gegensätzlichkeit die- 
ser verschiedenen Lebensmodelle wird über die Parallelmontage zweier 
Hochzeiten etabliert: die Hochzeit des französischen Konsuls mit Hoch- 
zeitsmarsch und Glockengeläute — die Hochzeit eines Insulanerpaars mit 
ethnischen Gesängen und rhythmisch geschlagenen Kokosnussschalen. 
Die Bedeutung der rituellen Klangsymbolik wird ausschließlich über die 
Analogie zur gefestigten christlichen Symbolik konstruiert. 


b) Orientierungsfunktion® 


e Zur Bezeichnung eines vermenschlichten Engels (Cary Grant) in THE 
BisHop’s WiFE (USA 1947, Henry Koster) 

e Zur Charakterisierung von ländlicher Idylle in Tue ALamo (USA 
1960, John Wayne) und in RAIDERS OF THE Lost ARK (USA 1980, Ste- 
ven Spielberg) 

e Big-Ben-Glocken zur Bezeichnung des Ortes in THe Dirty DOZEN 
(USA 1968, Robert Aldrich) 

e Als Hinweis auf Tageszeit (Morgen) in THE NAME OF THE ROSE 
(Frankreich/ Italien/BRD 1985, Jean-Jacques Annaud) 

° Zur Bezeichnung von Weihnachten in Das Boot (BRD 1981, Wolf- 
gang Petersen) 

e Das Setting Kirche bei Missionstatigkeit von MALCOLM X (USA 1991, 
Spike Lee) 


Die Orientierungsfunktion des Glockenläutens ist der einzige Komplex 
mit positiver Bedeutung. Erstaunlicherweise fehlt der Hinweis auf die 
berühmte ländliche Idylle im Korpus bis 1960 völlig. Eine mögliche Inter- 
pretation könnte der ausgeprägte symbolische Gehalt des Glockenläutens 
sein, der vorwiegend negativ besetzt ist. Wenn Spielberg in den 1980er- 
Jahren die ländliche Idylle mit Glockenläuten versieht, dann mit deutlich 
ironischem Unterton: Indiana Jones alias Dr. Jones als smarter, von den 
Mädchen angehimmelter Geschichtslehrer in der friedlichen Pampa. Die 
Ironie erscheint umso plastischer, als sich Rolle und Umfeld von Indiana 
Jones in dieser Szene (0.12.08-0.19.27) diametral zur Exposition verhalten, 
in welcher er in bekannter Abenteurermanier immer am Abgrund finste- 
rer Bedrohung durch entlegene indianische Höhlen streift. Obligatorisch 
für die distanzierende Ironie ist außerdem die Verdoppelung der Aussage 
Idylle durch das unvermeidliche fröhliche Vogelgezwitscher. 


3 Darunter verstehe ich den Hinweis auf einen Schauplatz (> Orientierung 298) 
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c) Tod 


° Totenglocken in Vampyr (Deutschland 1932, Carl Theodor Dreyer), 
TWELVE O’CLock HıcH (USA 1948, Henry King), THE GREAT CARU- 
so (USA 1951, Richard Thorpe) THE SOUND BARRIER (GB 1952, David 
Lean), THE ALAMO (USA 1960, John Wayne), LAWRENCE OF ARABIA 
(GB/ USA 1964, David Lean), THE DEER HUNTER (USA 1978, Michael 
Cimino), RAIDERS OF THE LOST ARK (USA 1980, Steven Spielberg), 
E.T. — THE EXTRATERRESTRIAL (USA 1982, Steven Spielberg), 48 Hrs. 
(USA 1983, Walter Hill), THE NAME OF THE Rose (Frankreich/Italien/ 
BRD 1985, Jean-Jacques Annaud), Ropocop (USA 1987, Paul Verhoe- 
ven), GLory (USA 1989, Edward Zwick), THE SILENCE OF THE LAMBS 
(USA 1991, Jonathan Demme), THE PLAYER (USA 1992, Robert Altman) 

e Zur Ankündigung von Krieg in THE ALAMo (USA 1960, John Wayne), 
als Warnung vor dem beginnenden Pogrom in THE FIDDLER ON THE 
Roor (USA 1971, Norman Jewison) 


Die Filmsprache hat ein reichhaltiges Arsenal an Todessymbolen ent- 
wickelt, die darauf schließen lassen, dass die konkrete Darstellung des 
Sterbens als Tabu empfunden wird. In VAMPyR (1932) von Dreyer läutet 
der Tod - als Sensenmann allegorisch personifiziert — die Glocken. In M - 
EINE STADT SUCHT EINEN MÖRDER (Deutschland 1931, Fritz Lang) ist es 
die Abwesenheit - bildlich vertreten durch den Blick in das leere Treppen- 
haus und auf den leeren Teller, dann durch einen davonrollenden Ball und 
zuletzt den Luftballon, der sich in den Hochspannungsdrähten verfangen 
hat- kombiniert mit Stille und dem Stundenschlag einer Kuckucksuhr, die 
den Tod symbolisiert. Ähnlich verfährt Spielberg mehr als vierzig Jahre 
später in Jaws (USA 1974): Die Mutter ruft den Namen des getöteten Kin- 
des in die Stille; die leise plätschernden Wellen tragen die zerfetzte Luftma- 
tratze an den Strand. Eine weitere Form der abstrakten Todesdarstellung 
ist der Kontrast zwischen bewegt und unbewegt: die fahrenden versus die 
stehenden Fahrräder in KUHLE WAMPE (Deutschland 1932, Slatan Dudow), 
die stehende Uhr, die gelöschte Kerze. Im amerikanischen Mainstreamfilm 
findet sich beispielsweise das Ziehen des Vorhangs - unter anderem in THE 
GREAT Caruso (USA 1951, Richard Thorpe) - und heute das Schließen des 
Reißverschlusses an der Leichenhülle — wie in E. T. — THE ExTRATERRES- 
TRIAL (USA 1982, Steven Spielberg), THELMA & Lourse (USA 1991, Ridley 
Scott) und THE SILENCE OF THE LAMBs (USA 1991, Jonathan Demme). Das 
Symbol - so könnte man diese Beobachtungen interpretieren - ersetzt das 
Unaussprechliche. 

Im Mainstreamfilm gibt es außerdem zwei Klassen von Todesfallen. 
In Science-Fiction- und Actionfilmen sterben die Feinde zuhauf, sang- und 
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klanglos, ohne Spuren zu hinterlassen. Niemand trauert, im Gegenteil, der 
Tod scheint einen positiven Gehalt zu haben, der Feind bedeutet fiir den 
Helden lediglich ein wesenloses Hindernis, das aus dem Weg geräumt 
werden muss. Die Glocken jedoch sind ausschließlich der anderen Klasse 
von Toten vorbehalten, jenen Toten nämlich, die über eine differenzierte 
Identität verfügen und um die getrauert werden darf. Ohne plausible Ver- 
knüpfung mit dem Ort klingen sie entweder versteckt im Hintergrund, 
oder sie erscheinen als extradiegetische Elemente der Musik. Die herz- 
zerreißende Sterbeszene in E. T. — THE EXTRATERRESTRIAL ist in mancher 
Hinsicht eine Ausnahme. Es ist äußerst selten, dass das Sterben als langer 
qualvoller Vorgang geschildert wird. In E. T. — THE ExTRATERRESTRIAL aber 
sind deutliche Parallelen zur messianischen Heilsgeschichte vorhanden, 
angefangen mit der lichtvollen Ankunft der Außerirdischen, weiterge- 
führt in der Stall-zu-Bethlehem-Ikonografie des Geräteschuppens bis hin 
zu Tod und Wiederauferstehung, die das Sterben als mehr vergeistigten 
Akt der Reinigung und Erlösung erscheinen lassen. 

Die Todesdarstellung im Mainstreamfilm wird in den Abschnitten 
Glas (> 360), Stille (> 231) und Zeitlupe (> 401) noch weitergehend dar- 
gestellt. 


d) komplexere Modifikation der Glockensymbolik 


° in der apokalyptisch düsteren Stimmung nach der Kreuzigung 
Christi in BEN-Hur (USA 1959, William Wyler, 3.15.45-3.20.00) 

e als Bestandteil der Parallelmontage der kultischen Schlachtung eines 
Ochsen und der rituell angelegten Tötung von Colonel Kurtz in 
APOCALYPSE Now (USA 1979, Francis Ford Coppola, 1.59.18-2.21.05) 

e übernatürliche Erscheinungen (beim Öffnen der Bundeslade) in Rar- 
DERS OF THE LOST Ark (USA 1980, Steven Spielberg) und des Hei- 
ligen Grals in INDIANA JONES AND THE LAST CRUSADE (USA 1988, 
Steven Spielberg) 

e Glocken verhallt und verfremdet: psychische Grenzsituation wäh- 
rend der Boxkämpfe in RAcınG BuLL (USA 1980, Martin Scorsese), 
wiederkehrend in RUMBLE FısH (USA 1983, Francis Ford Coppola) 
und bei der Erinnerung Griffin Mills an die Ermordung des Dreh- 
buchautors David Kahan ein THE PLAYER (USA 1992, Robert Altman) 

e mit Stress assoziiert in THE RIGHT STUFF (USA 1983, Philip Kaufman) 
beim ersten Start in den Weltraum 

° zur Bezeichnung eines karikiert überzeichneten boshaften Richters 
in WHo FRAMED ROGER RABBIT? (USA 1988, Robert Zemeckis) 

e Glocken bei Bedrohung in der Musik in THE HUNT FOR RED OCTOBER 
(USA 1990, John McTiernan) 
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Aufgrund der Tatsache, dass die Glocken erst mehrere Jahrhunderte nach 
Christi Geburt vom Christentum übernommen wurden, werden sie in 
Ben-Hur als Symbole der Apokalypse in die Musik integriert. 

Ähnlich verfahren Coppola/Murch/Beggs in ArocAıyrse Now. In 
einer beispiellos exaltierten Anhäufung von Symbolen verschiedener Pro- 
venienz — von Nebel über Dunkelheit, Dschungel, Raben, Donnern, kul- 
tische Zeremonie mit unklarem Hintergrund - taumelt der Film in einer 
unrealen, albtraumhaft wirkenden Szene seinem Höhepunkt zu. Kurtz, 
die abgedriftete ehemalige Koryphäe der amerikanischen Armee, der im 
tiefsten Dschungel wie eine Gottheit herrscht, wird das Opfer einer rituell 
inszenierten Tötung. Die Glocken sind rhythmischer Bestandteil der die- 
getischen Musik in der Zeremonie der Opferschlachtung eines Ochsen. Ihr 
Klang ist irgendwo zwischen heidnischen Schellen und asiatischen Game- 
lans angesiedelt. 

In all den hier erwähnten Beispielen handelt es sich um die synkre- 
tistische Verschmelzung von sehr verschiedenartigen Einflüssen zu einer 
modifizierten Symbolkonstruktion, deren emotional negative Färbung auf 
die Todesassoziation der Glocken zurückgreift. 


Uhren 


Wie Schafer darstellt, ist die Achse Glocke - Sterblichkeit ein fester Bestand- 
teil der christlichen Ideologie, die von der traditionellen Verbindung der 
Glocke zur Uhr perpetuiert wird: 


Die Verbindung zwischen Uhren und Kirchenglocken war keineswegs 
zufällig; denn das Christentum vertrat die Idee, dass die Zeit linear fort- 
schreitet[...]. 
Die Zeit geht im christlichen System immer zu schnell vorbei, und die Kir- 
chenglocke verdeutlicht diese Tatsache. Ihre Glocken sind akustische Signa- 
le, aber selbst auf einer unterschwelligen Ebene liefert der unaufhörliche 
Rhythmus ihres Tickens dem westlichen Menschen einen Grundton mit 
unausweichlicher Bedeutung. Glocken reichen bis in die innersten Tiefen der 
Nacht, um die Menschheit an ihre Sterblichkeit zu erinnern.* 

(Schafer 1977: 77) 


4 «The association of clocks and church-bells was by no means fortuitous; for Christian- 
ity provided the rectilinear idea of the concept of time as progress [...]. Time is always 
running out in the Christian system and the clock bell punctuates this fact. Its chimes 
are acoustic signals, but even at a subliminal level the incessant rhythm of its ticking 
forms a keynote of unavoidable significance in the life of Western Man. Clocks reach in 
the recesses of night to remind man of his mortality.» 
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Die Uhr als Stundenschlag oder als Ticken hingegen symbolisiert auf 
der Tonspur eher selten das Thema Vergänglichkeit, unteranderem in 
THE Exorcist (USA 1973, William Friedkin) oder in Tuis LAND Is MINE 
(USA 1943, Jean Renoir). Eher noch ist sie eine konkrete Form der Zeit- 
darstellung, wenn die Spannung mit einer wie auch immer ablaufenden 
Zeit korrespondiert. Prototypisch in SPEED (USA 1994, Jan de Bont), wenn 
der Wettlauf gegen eine tickende Zeitbombe den Grundpfeiler der Span- 
nungserzeugung bildet. Naturgemäß in ORLANDO (GB 1992, Sally Potter), 
in dem die historische Chronologie auch über die Titel ständig präsent ist; 
dort erscheint Vergänglichkeit als Grundthema mit umgekehrten Vorzei- 
chen, wenn der Protagonist / die Protagonistin die Jahrhunderte unbe- 
schadet durchwandert. Einen Sonderfall der Uhrensymbolik stellt Rum- 
BLE FısH (USA 1983, Francis Ford Coppola) dar. Nicht nur werden Uhren 
dort in allen Variationen visualisiert, sondern die Zeit wird auch ständig 
subjektiv als Zeitlupe zerdehnt oder im Zeitraffer komprimiert. Verfrem- 
dete Stundenschläge, rhythmisiertes Ticken von Percussioninstrumenten, 
Grillen, Wassertropfen und Uhren akzentuieren das somnambule Getrie- 
bensein des Helden und seines Bruders. Das dichte Gewebe von irreal ver- 
änderten Zeitsymbolen lässt sich mühelos als eine von der Realität abge- 
koppelte Wahrnehmungsform zweier Individuen interpretieren, denen 
das Zeitempfinden abhandengekommen ist und die mehr und mehr aus 
allen Rastern fallen. 

In der Mehrzahl aller Fälle jedoch meint das hörbare Uhrenticken 
auf der Tonspur etwas anderes: die stockende Zeit. Es markiert eine ange- 
spannte oder peinliche Stille, in welcher die Zeit kaum vorwärtszuge- 
hen scheint, das Verharren in Monotonie. Sei das in OUT oF AFRICA (USA 
1985, Sydney Pollack, 1.51.18-1.52.38), wenn der ungetreue Ehemann 
vorbeikommt, um Geld zu holen, sei das in der Beerdigungshalle in THE 
SILENCE OF THE LAMBS (USA 1991, Jonathan Demme, 0.39.22-0.44.00), als 
sich die wartenden Polizisten weigern, der Aufforderung hinauszugehen 
Folge zu leisten, und damit die Autorität von Clarice Starling ostentativ 
infrage stellen. Mehrfach ist es auch in Das Boor (BRD 1981, Wolfgang 
Petersen) zu hören, wo Monotonie und Anspannung zu einem unheilvol- 
len Grundmuster werden, verbunden mit der ständigen Erwartung einer 
plötzlich zuschlagenden Vernichtung. Als eigentliches Todessymbol wird 
das Ticken in THE Exorcist (USA 1973, William Friedkin) bereits in der 
Exposition (0.00.41-0.10.01), einem episch angelegten Prolog, etabliert und 
später dem todgeweihten Exorzisten zugeordnet. 
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Tiersymbole 


Der Rückgriff auf gut etablierte Symbole aus dem christlichen Fundus 
kommt dem Bemühen um Klarheit und Verständlichkeit entgegen. Zu 
dieser Gruppe von Symbolen gehört die Assoziation Hahnschrei — Verrat, 
gefunden in Tus LAND Is MINE (USA 1943, Jean Renoir, 0.52.27-0.55.34), 
PLATOON (USA 1986, Oliver Stone, 0.34.44-0.56.15) und THE Prano (Neu- 
seeland 1992, Jane Campion, 1.30.54-1.39.17), drei Filmen, in denen die 
Problematik des Verrats eine zentrale Rolle spielt. Außerdem ist der Hahn 
in Jurassic PARK (USA 1993, Steven Spielberg) zu hören, wenn der dicke 
Verräter angeheuert wird, um Dinosaurier-Embryonen zu entführen. Die 
Hahnsymbolik ist jedoch nicht obligatorisch. Ein krähender Hahn kann 
auch schlicht Bestandteil des Settings Bauernhof sein. 

In ihrer Funktionsweise unterscheiden sich die Tiersymbole von den 
Glocken. Sie gehören zum Typus der Metapher, der Bedeutungsübertra- 
gung durch ein Nebeneinanderstellen von zwei Konzepten, die sich nur 
partiell decken. «Auf die einfachste Formel gebracht, bringen wir beim 
Gebrauch einer Metapher zwei unterschiedliche Vorstellungen in einen 
gegenseitigen aktiven Zusammenhang» (Richards 1936: 34). Auf die Tier- 
symbolik bezogen, bedeutet es, einen mythologisch oder religiös moti- 
vierten Aspekt des Tiers auf eine Figur, Situation oder Handlung zu über- 
tragen. 

Die Herkunft anderer Typen von Tiersymbolik sind weniger klar, 
wahrscheinlich handelt es sich mehrheitlich um Lerneffektederkonti- 
nuierlichen Auseinandersetzung mit medialen Repräsentationen. Dazu 
gehören die Raben und Krähen als Todessymbol, das im Gegensatz zum 
positiven Aspekt des Raben als Bote Gottes nicht nur in der Bibel, sondern 
auch in anderen Religionen steht (Lurker 1988: 599). Mögliche Ursachen 
der Symbolmodifikation sieht Heinz-Mohr (1971: 242 ff.) in der schwar- 
zen Farbe, im durchdringenden Schrei und in der Tatsache begründet, 
dass Raben Aasfresser sind. Die Rabensymbolik ist ein fester Bestandteil 
sehr vieler Tonspuren, von LAWRENCE OF ARABIA (GB/USA 1963, David 
Lean) über E. T. — THE EXTRATERRESTRIAL (USA 1982, Steven Spielberg) bis 
ORLANDO (GB 1992, Sally Potter). Auch die symbolische Bedeutung der 
Katze ist unklar. Sie wird mehrfach assoziiert zu Eitelkeit und sexueller 
Begierde, zum Beispiel in 48 Hrs. (USA 1983, Walter Hill), in DANGEROUS 
Liaisons (USA 1988, Stephen Frears), in THE SILENCE OF THE LAMBS (USA 
1991, Jonathan Demme) und wiederum in ORLANDO (GB 1992, Sally Pot- 
ter), der eine geradezu idealtypische Fundgrube für die Untersuchung von 
Symbolen auf der Tonspur darstellt. 
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Schlüssel und Türen 


Es ist unmöglich, im Rahmen dieser Arbeit sämtliche Symbole ausrei- 
chend darzustellen, lediglich zwei wichtige Typen seien hier noch ange- 
sprochen: die Schlüssel und die Türen. Die Schlüssel sind laut Lurker 


als Bild für Öffnen und Schließen zugleich Ausdruck für die seinem Besitzer 
verliehene Vollmacht. In der griechischen Mythologie besaß Hekate als Türhü- 
terin den Schlüssel zum Hades. In dem gnostischen Werk Pistis Sophia dient 
der Schlüssel als sprachliches Bild für die Mysterien, die dem Eingeweihten 
den Himmel erschließen. Im Märchen kann der Schlüssel den erschwerten 
Zugang zu Geheimnissen und Schätzen andeuten. (Lurker 1988: 650 f.) 


Auf der Tonspur wird das charakteristische metallische Klingeln von 
Schlüsseln mehrheitlich Personen zugeordnet, die eine solche Vollmacht 
besitzen: Polizisten, Psychiatrieschwestern, Gefängniswärtern. Die Poli- 
zisten werden in reduktionistischer Manier fast ausschließlich über das 
Attribut des Schlüsselbunds charakterisiert, unter anderem im Film IN THE 
HEAT OF THE NIGHT (USA 1966, Norman Jewison), wo der Protagonist, ein 
schwarzer FBI-Beamter, zunächst aufgrund seiner Hautfarbe als Verdäch- 
tiger eingestuft wird, während das Klingeln des Schlüsselbunds bereits 
auf seine offizielle Funktion hinweist. Auch die Suchtrupps in E. T. — THE 
EXTRATERRESTRIAL (USA 1982, Steven Spielberg) werden fragmentarisch 
über den Schlüsselbund exponiert, der im Schein einer Taschenlampe auf- 
leuchtet, mehr noch, die Personen bleiben fragmentiert auf aggressiv wir- 
kende Attribute — zu den Schlüsseln kommen noch die Stiefel - und sind 
als Ganzes kaum jemals zu sehen. 

Wie in E. T. — THE EXTRATERRESTRIAL sind die Schlüssel auch in THE 
HURRICANE (USA 1937, John Ford) und THE SNAKE Pit (USA 1948, Ana- 
tole Litvak) aus der Sicht des Opfers negativ besetzt. Der Schlüssel wird 
zum Symbol des Eingeschlossenseins. Der Südseeinsulaner Terangi in THE 
HURRICANE würde daran zerbrechen, wenn ihn nicht der Sturm aus der 
Gefangenschaft befreien würde. THE SNAKE PIT, ein Melodrama um eine 
Frau am Rande des Irrsinns, gibt zwar vor, das Opfer durch brachiale psy- 
chiatrische Methoden zu heilen, auf der perzeptiven und symbolischen 
Ebene hingegen wird diese Aussage permanent unterlaufen, besonders im 
nervös präsenten Schlüsselklingeln. Ob dieser gegenläufige Subtext inten- 
diert war, wer ihn eingebracht oder verursacht hat, lässt sich heute wohl 
nicht mehr feststellen. Möglich wäre auch, dass diese Schlüsselsymbolik 
Ende der 1940er-Jahre noch nicht im gleichen Ausmaß etabliert war wie 
heute. Außer in Fords THE HURRICANE findet es sich im Korpus erst ab 
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Ende der 1970er-Jahre gehäuft. Aufschlussreich ist auch, dass es im Proto- 
typ des Gefängnisfilms, in THE Bic House (USA 1930, George Hill), völlig 
fehlt, in TERMINATOR 2 (USA 1991, James Cameron) und THE SILENCE OF 
THE LAMBS dagegen als unverzichtbares Element zur Zeichnung der psy- 
chiatrischen Anstalt erscheint. 

Ähnlich gelagert ist die Symbolik der Türen. Türen und Tore sind 
nach Lurker (1988: 773) Symbole der Abgrenzung und des Übergangs. 
Die Tür als Element der Tonspur wurde ausführlich behandelt. Schon 
dort wurde klar, dass sich verschiedene Typen fundamental voneinan- 
der unterscheiden. Nur ein Bruchteil aller auf Tonspuren zu ermittelnden 
Türen dürfte eine symbolische Bedeutung haben. Im Fall von THE SILENCE 
OF THE LAMBS geht der tiefere Gehalt aus einer Reihe von Indizien hervor. 
Erstens sind die Türen außergewöhnlich exakt herausgearbeitet, zwei- 
tens deutlich vergrößert, und drittens fokussieren sie die Aufmerksamkeit 
durch auffällig häufige Wiederholung. Die große Anzahl von seriell hinter- 
einander angeordneten Türen markiert die extreme Abartigkeit des psy- 
chisch deformierten Dr. Lecter. Als weiteres Grundthema des Films kann 
das Thema des Übergangs angesehen werden, den die Protagonistin Cla- 
rice Starling und ihr Antagonist Buffalo Bill durchlaufen. Der Übergang 
wird bildlich auch von den zahlreich erscheinenden Insekten in verschie- 
denen Entwicklungsstadien symbolisiert, am ausgeprägtesten natürlich 
im Kokon des Totenkopfschwärmers, den Buffalo Bill in den Rachen seiner 
Opfer steckt (> Modellanalyse THE SILENCE OF THE LAMBS 429). 


Key Sounds 


Neben den Symbolen, die in außerfilmischen Traditionen begründet 
sind, also aus einem vorgeformten Wissensbestand Bedeutungserweite- 
rung importieren, werden von einigen Filmen eigenständige symbolische 
Bedeutungen generiert. Der Begriff Symbol erscheint mir für diese Phä- 
nomene nicht adäquat, besonders deshalb, weil sie sich in ihrer Genese 
unterscheiden. Terminologisch ist dieses Gebiet nicht erschlossen. Mit 
Wuss (1993: 138), der von Schlüsselbildern spricht, um das Phänomen 
auf der bildlichen Seite zu fassen, werde ich solche Klangobjekte als Key 
Sounds bezeichnen. Mit Key Sounds sind demnach Klangobjekte gemeint, 
welche aufgrund ihrer deutlich wahrnehmbaren intratextuellen Häufung, 
der strategischen Platzierung zumeist in der Exposition und weiteren 
Kernszenen sowie der Integration in die exponierte Grundthematik mit 
einer spezifischen Bedeutung geladen werden. Der Rezipient erkennt in 
der Strukturbildung eine Regelmäßigkeit, die zur Hypothese führt, dass 
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mit dem Key Sound eine tiefere Bedeutung verbunden sei. Anders als 
das Leitmotiv (> 183), das auf einem ähnlichen Mechanismus aufbaut, 
geht die Bedeutungsmodifikation von Key Sounds nicht auf die Relation 
zu bestimmten Ereignissen, Orten, Figuren oder Ideen zurtick. Vielmehr 
entsteht im Austausch mit dem narrativen Kontext, mit der aboutness 
(«Worum zum Teufel geht es?», Eco 1987: 114), eine Art Resonanz, welche 
den Key Sound gegentiber anderen Klangobjekten privilegiert. Klanglich 
schlagt sich die privilegierte Stellung in einer sorgfaltigeren, varianten- 
reicheren Ausgestaltung sowie zumeist auch in Formender Verfremdung 
und Vergrößerung nieder. 

Das vielleicht berühmteste, auf jeden Fall einleuchtendste Beispiel 
eines Key Sound ist das Klangobjekt Hubschrauber in APOCALYPSE Now 
(USA 1979, Francis Ford Coppola). In der Eröffnungsszene durchfliegt der 
Hubschrauber den Kinoraum in allen vier Quadranten von hinten rechts 
über hinten links, vorne links, nach vorne rechts. Zu hören ist außerdem 
der Song «The End» von den Doors, zu sehen sind die brennenden Wäl- 
der Vietnams. Überblendung auf den langsam rotierenden Deckenventi- 
lator, immer noch begleitet vom ätherisch verfremdeten Hubschrauber- 
geräusch. Allein die perzeptiven Qualitäten wie die extreme Räumlichkeit 
und die Differenzqualität zur alltäglichen Hubschrauberwahrnehmung 
durch Verfremdung führen schon zur Aufmerksamkeitsfokussierung. Die 
Brutalität des Vietnam-Kriegs als Grundthematik, als aboutness, kann nicht 
nur von vornherein als bekannt angenommen werden - der Zuschauer 
weiß, in welchen Film er geht -, sondern sie wird in dieser Expositions- 
szene durch das Konglomerat von visualisierter Zerstörung, Wahrneh- 
mungsverschiebung aufgrund von Drogenkonsum und endzeitlicher 
Pop-Dekadenz gleich mehrfach vertieft (> Fallstudie APOCALYPSE Now 
383). Später sind Hubschrauber die Hauptakteure im ebenfalls berühmten 
Angriff auf ein vietnamesisches Dorf, wo sie zu Wagners «Walkürenritt» 
choreografiert werden. 

Damit sind alle Grundelemente des Key Sound hinreichend vorhan- 
den: Korrelation mit der Thematik, perzeptive Auffälligkeit und strate- 
gische Platzierung in der Exposition. Bezogen auf den Film hält sich die 
Häufigkeit mit 8% eher in Grenzen. Und je mehr sich die Mannschaft 
flussaufwärts in Richtung Kurtz bewegt, desto mehr lässt sie auch den 
Hubschrauber hinter sich; in der zweiten Hälfte ab 1.17.19 ist er überhaupt 
nicht mehr zu hören. 

Mehr als um eine Bedeutungsausdehnung scheint es sich hier um 
eine Verdichtung zu handeln, eine Art Implosion externer Elemente in das 
Klangobjekt Hubschrauber, das zur hochpotenzierten Essenz wird. Diese 
Konstellation ist auch auf dem Hintergrund der anderen Vietnam-Filme 
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interessant. Im Korpus sind dies THE DEER HUNTER (USA 1978, Michael 
Cimino) und PLATOON (USA 1986, Oliver Stone). THE DEER HUNTER - ein 
Jahr vor ArocALyPsE Now in den Kinos — beutet den Hubschrauber mit 
lediglich 3% deutlich weniger aus, während PLATOON - später realisiert — 
sich mit 6% bereits der etablierten Symbolik bedient. THE DEER HUNTER 
baut - wie oben dargestellt (> 162) — seine Hexenkesselsymbolik mit 
anderen Mitteln auf. In PLAToon hingegen ist der Hubschrauber schon in 
der ersten Szene präsent, der Anreise des unbedarften Vietnam-Novizen, 
während im Hintergrund die zurückgeschafften Leichen in Plastikhüllen 
verladen werden. Diese Daten sind natürlich zur statistischen Erhärtung 
nicht ausreichend, deuten jedoch als erster Hinweis auf einen Verfesti- 
gungsprozess, der an anderen Beispielen überprüft werden müsste. 


Stereotype 


Mitte der 1980er-Jahre begann sich der medientheoretische Begriff Stereo- 
typ von seiner ursprünglich sozialpsychologischen Konzeption zu lösen 
und seine negativ wertende Färbung aufzugeben. Federführend für diese 
Umgestaltung sind sowohl die Arbeiten Umberto Ecos (1987, 1995), der 
sich verschiedenen Kulturphänomenen zuwendet, wie einige Aufsätze 
von Jörg Schweinitz (1986, 1987, 1990 und 1991), der sich mit der spezi- 
fischen Wirkungsweise von Stereotypen in der populären Filmkultur aus- 
einandersetzt. Aufbauend auf diesen Ansätzen wird bei Wuss (1993) die 
filmästhetische Stereotypenkonzeption zu einem von drei tragenden Pfei- 
lern seines Modells der Filmrezeption. Damit reagierte die Theorie auf die 
mehr und mehr zu beobachtende Tendenz der populären Massenmedien, 
immer gleiche Formen und Motive zu recyceln, wie sie in zahlreichen 
Serien der Trivialliteratur, im Fernsehen und im Mainstreamfilm zu beob- 
achten sind. 

Zwar war dieses Phänomen nicht neu. Der russische Formalist Vik- 
tor Schklowski hatte bereits 1924 festgestellt: «Der Massenleser liebt 
die endlose Wiederholung der immer gleichen Abenteuer, und er mag 
es, wenn sie auf immer gleiche Art und Weise bestanden werden» (in 
Schweinitz 1990: 10). Wladimir Propp hatte eine solche Kanonisierung 
von erzählerischen Konstellationen in seiner Morphologie des Märchens 
(1928) auch in der traditionellen Form des russischen Zaubermärchens 
ausgemacht. 

Was nun sind Stereotype? Als Erster hat Lippmann 1922 den Begriff 
aus der Buchdruckersprache, wo er die in Blei gegossenen Lettern bezeich- 
nete, in die Sozialwissenschaften importiert, um die Verfestigung von Ein- 
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stellungen zu Vorurteilen zu beschreiben. Wie Lilli (1982: 3) schreibt, ging 
es schon in dieser Konzeption um die Diskrepanz zwischen vereinfachten 
inneren Vorgängen und komplexer äußerer Welt zum Zweck der Orientie- 
rung. Die Vereinfachung resultiert laut Lippmann (1922: 89) aus der Ein- 
stellungsgenese durch Überlieferung: «Wir werden über die Welt belehrt, 
bevor wir sie sehen. Wir stellen uns Dinge vor, bevor wir sie erfahren. Und 
dieses Vorwissen prägt den ganzen Vorgang unserer Wahrnehmung aufs 
Intensivste.»° Die negativ wertende Auffassung von Stereotypen in der 
Sozialpsychologie hängt damit zusammen, dass «solche Einstellungen 
zu Barrieren für Erkenntnis und Kommunikation werden können, indem 
sie Unangemessenheiten des Urteils konservieren» (Wuss 1993: 162). Eine 
positive Wertung erfahren Stereotype durch die sichernde Funktion für 
das Selbstverständnis und die Interaktion in der Gruppe. 

Bei der Übersetzung auf die Filmwahrnehmung sind einige der kons- 
tituierenden Momente des Begriffs Stereotyp erhalten geblieben, während 
andere modifiziert wurden. Ich stütze mich bei der folgenden Begriffs- 
bestimmung hauptsächlich auf die Publikation von Wuss (1993) und den 
äußerst dichten und informativen Aufsatz von Schweinitz (1990). 

Als Grundcharakteristikum der Filmstereotype wird die massen- 
hafte Wiederholung von erzählerischen Konstellationen und damit ein- 
hergehenden optischen und akustischen Repräsentationsformen gesehen. 
Schweinitz (1990: 10 ff.) bezeichnet sie als «homologe, intertextuelle Struk- 
turen», das heißt, Strukturen, die über eine größere Anzahl von Filmen 
während längerer Zeit unverändert bleiben. Damit werden sowohl der 
Aspekt der Verfestigung sowie deren Entstehung durch Überlieferung aus 
dem Originalkonzept beibehalten. 

Stereotype unterliegen einem Lernvorgang. Sie schreiben sich erst 
über häufige Wiederholung ins Langzeitgedächtnis ein, wo sie als film- 
kulturelle Konstante verankert werden. Durch die ständige Nutzung in 
einem kommunikativen Gebrauchszusammenhang werden sie zur laten- 
ten Erwartungsnorm. Sowohl Wuss als auch Schweinitz bezeichnen die- 
sen Vorgang als Wahrscheinlichkeitslernen, das auf der weitgehend unbe- 
wussten Extraktion von Invarianten im Reizmaterial gründet. Was damit 
gemeint ist, schildert Schweinitz plastisch: 


Als medienerfahrener Zuschauer können wir im Großen und Ganzen bald 
abschätzen, welcher Typus von Erlebnissen uns erwartet, wenn wir die Ex- 
position eines Western, eines Detektiv- oder eines Katastrophenfilms gesehen 


5 «Weare told about the world before we see it. We imagine things before we experience 
them. And those preconceptions govern deeply the whole process of perception.» 
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haben. Wir kennen die Verwicklungen einer Liebe aus zahlreichen Melo- 
dramen, die turbulenten Kämpfe und Verfolgungsjagden, die Rettungen in 
letzter Sekunde aus den Abenteuerfilmen. (Schweinitz 1990: 10) 


Teilweise werden Stereotype bewusst wahrgenommen. Besonders einge- 
fleischte Fans bestimmter Genres beziehen einen großen Teil des Genusses 
aus der Kennerschaft; sie freuen sich über das Wiedererkennen der immer 
gleichen Konstellationen in neuer Aufmachung. Auf der Basis des Vor- 
wissens werden Erwartungen aufgebaut, die im Mainstreamfilm deshalb 
überwiegend bedient werden: 


Die Strukturierung eines Films auf der Grundlage von Stereotypen durch 
den Produzenten entlastet mithin den Rezipienten von aufwendiger Struk- 
turierungsarbeit, langwierigem Hypothesenpriifen, erlaubt es ihm, die filmi- 
sche Reizinformation unaufwendig auf sein Schema-Repertoire zu beziehen. 
Negative Emotionen, die entstehen, wenn die rezeptiven Schemata und die 
Rezeptionsvorgaben nicht in Ubereinstimmung zu bringen sind, werden 
vermieden. (Schweinitz 1990: 12) 


Auf der weitgehend automatisierten Verarbeitung von Stereotypen grün- 
det eine ihrer wichtigsten Funktionen. Durch die Gewöhnung werden sie 
unauffällig, verblassen und sinken in immer tiefere Schichten des Geistes 
ab. Wie oben dargestellt (> Identifikation einer Quelle 109), prägen sich im 
Gehirn die plastischen Konnektionen, welche die einzelnen Knoten mit- 
einander verbinden, umso stärker aus, je öfter sie aktiviert werden. Das 
bedeutet, dass mit zunehmender Erfahrung die Aktivierung dieses Mus- 
ters immer schneller und automatischer verläuft. Die Beiläufigkeit, mit der 
es rezipiert wird, trägt zur Ökonomisierung der Wahrnehmung bei. In der 
beschränkten Kapazität des Bewusstseins schafft sie Platz für andere For- 
men der Informationsverarbeitung. Weitere Funktionen sind die Affirma- 
tion der eigenen Einstellungen, die auch als Beruhigung durch den rituel- 
len Charakter beschrieben werden kann. Rituale geben dem Individuum 
ein Gefühl der Ordnung und Sicherheit. Im Rahmen von ritualisierten 
Strukturen können negative Emotionen wie Stress oder Aggressionen als 
genussvoll erlebt werden, weil das Ritual ein positives Meistern negativer 
Gefühle einschließt. Eine massenhafte Verwendung von Stereotypen gibt 
dem Zuschauer die Sicherheit, auch in extremen Situationen nie den Halt 
zu verlieren, weil die Grenzen strukturell nie wirklich gesprengt werden. 
Aus diesem Grund sind besonders die gewalttätigen Genres — Action-, 
Science-Fiction- und Horrorfilme - signifikant häufiger von Stereotypen 
übersät. 
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Eine weitere Funktion mit ebenfalls affirmativer, ordnender Aus- 
wirkung ist die Komplexitätsreduktion. Stereotype tragen zur Orientie- 
rung bei, indem sie entweder Ähnlichkeiten oder Unterschiede überbe- 
tonen. Die Betonung von Ähnlichkeiten ist eine Form der Generalisierung. 
Sie kommt in den standardisierten formelhaften Konstellationen zur 
Anwendung, welche dem oben beschriebenen Wiedererkennungswert 
zugrunde liegen. Die Betonung von Unterschieden - Lilli (1982: 14) 
nennt sie Dichotomisierung — führt zur Erleichterung der Bewertung 
über Kontraste. In diese Kategorie fallen zum Beispiel stereotypisierte 
Farbcodes wie in STAR Wars: Die Guten sind weiß gekleidet, der Böse — 
Darth Vader - schwarz. Dieser Kontrast äußert sich übrigens auch in 
der Klanglichkeit der verschiedenen Settings: Dem bösen Empire ist ein 
bassig moduliertes unheimliches Geräusch zugeordnet, die Settings der 
Guten werden über vertraute Geräusche in einem mittleren Frequenzbe- 
reich charakterisiert. 

Schweinitz weist darauf hin, dass Stereotype Strukturen darstel- 
len, die sich von Anfang an als wirksam erwiesen haben. Im Besonderen 
geht er davon aus, dass die Prägnanz einer Repräsentationsform darüber 
entscheidet, ob sie sich als Stereotyp eignet oder nicht. Die Prägnanz ist 
gekennzeichnet durch die Deutlichkeit und Einfachheit eines Objekts. 
Diese Anforderungen sind im vorne dargestellten Prototyp (> 143) in 
idealer Weise vorhanden. Prototypen können deshalb durch mehrfachen 
Gebrauch zu Stereotypen mutieren. Im Bereich der Prägnanz kommen 
wir auch zu einer Schnittmenge von Symbolen, Signalen und Stereo- 
type. So sind es häufig symbolbehaftete Objekte oder Signale, die stereo- 
typisiert werden, wie zum Beispiel Schlüssel, Glocken oder Uhren. Sie 
bringen nicht nur eine vorgeformte Bedeutung in den Text, sondern ver- 
ändern sich im Lauf ihrer Mutation zum Stereotyp auch auf der Bedeu- 
tungsebene. Dieser Mechanismus lässt sich wiederum anhand des Glo- 
ckenläutens darstellen: Wie gezeigt wurde, bevorzugen sehr viele Filme 
die Assoziation Glocken — Tod. Dadurch wird diese Assoziation weiter 
gefestigt, sodass sie mehr und mehr autonom wird. Das Glockenläu- 
ten als solches aktiviert ein emotionales Skript, das mit Trauer und Tod 
korreliert. Es tritt ein Optimierungseffekt der affektiven Kontrolle der 
Rezipienten ein, jenes unausweichlich suggestive Moment, in dem die 
Massen synchron zu den Taschentiichern greifen oder in Gelächter aus- 
brechen. 

Stereotype werden im Laufe ihrer Entstehung jedoch nicht nur zei- 
chenhaft verdichtet, sondern erfahren auch eine spezifische Bedeutungs- 
erweiterung. Indem sie immer wieder in einem bestimmten Genre und 
einem bestimmten Umfeld auftreten, assimilieren sie zusätzlich die Bedeu- 
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tungen ihres Kontexts. Querschläger werden so zum Zeichen des Wes- 
terns, das unermüdliche Fiepen futuristischer Computeranlagen zum Zei- 
chen des Science-Fiction-Films und das grottenhaft hohl verhallte Tröpfeln 
zu jenem des Horrorfilms. Der postmodern medienkundige Autor beutet 
solche sekundären Bedeutungen aus, indem er sie in virtuoser Manier neu 
zusammenstellt und mit den normierten Erwartungen der Rezipienten 
spielt. 

Ein wesentlicher Aspekt der Stereotyptheorie fehlt in Schweinitz’ 
Aufsatz, nämlich die zeitliche und kulturelle Determinierung, die — wie 
eingangs erwähnt - ein Merkmal aller Bedeutungen höherer Ordnung ist. 
Stereotype sind großenteils nur während einer bestimmten historischen 
Phase und in einer bestimmten Kultur wirksam. Wuss spricht in diesem 
Zusammenhang von einem dissipativen System: «Dissipative Struktu- 
ren [...] sind dynamischer Art und führen Ordnung gleichsam durch 
Schwankungen herbei. Sie benötigen eine hohe Energiezufuhr und kön- 
nen ihre Ordnungszustände nur unter Vergeudung, also Dissipation, von 
Entropie aufrechterhalten» (Wuss 1993: 188). 

Das heißt, dass Stereotype nur solange verstanden werden, als die 
massenhafte intertextuelle Wiederholung sie immer wieder nährt und 
damit am Leben erhält. Beispielsweise ist eine Reihe von geschlechts- 
spezifischen Stereotypisierungen des klassischen Hollywoodfilms unter 
dem Einfluss eines sich wandelnden gesellschaftlichen Bewusstseins ver- 
schwunden. Wir verstehen sie heute nur noch, wenn wir Filme aus dieser 
Zeit gehäuft rezipieren. 

Stereotype sind insgesamt nicht leicht zu bestimmen. Als ausge- 
prägte Kunstfilm-Hardlinerin hatte ich zu Beginn meiner Beschäftigung 
mit dem Mainstreamfilm Mühe, sie überhaupt zu erkennen. Für den Ein- 
stieg eignen sich Filme, die in parodistischer oder postmoderner Attitüde 
Stereotype geradezu ausstellen, wie zum Beispiel WALLACE & GROMIT — 
A GRAND Day Our (GB 1992, Nick Park). Rund um den Start und die Reise 
zum Mond sind folgende Stereotype auszumachen: 


° das bereits erwähnte höhlenhafte Tröpfeln 

° die Computersounds 

° ein übertrieben wirkender Hall 

° das bassige Grummeln unbekannter Herkunft 

e das Knistern der Zündschnur 

e das donnernde Aufbrechen des Tors mit dumpfem Knall verhallt 

e der metallische Querschlägerklang von auf die Rakete auftreffenden 
Gartenzwergen 

e der drohende Bläsertusch beim Vergessen der Crackers 
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e der donnernde Start 

e der Raketensound im Weltall 

° die Alarm-Beeps 

e das Absinken der Frequenz bei der Verlangsamung der Rakete vor der 
Landung 

° der Wind auf dem Mond 


Eine entsprechende Szene lässt sich in fast jedem Science-Fiction-Film fin- 
den, zum Beispiel in ALIENS — THE RETURN (USA 1986, James Cameron, 
0.26.43-0.33.33). Ein spezifisches Merkmal einiger dieser Stereotype ist es, 
dass sie sich von der physikalischen Realität unterscheiden: Weder win- 
det es auf dem Mond, noch verursachen Raumschiffe im luftleeren Uni- 
versum ein Fahrgeräusch, Computer pflegen im Allgemeinen nur dann 
zu fiepen, wenn sie falsch bedient werden. Wenn jedoch in neueren Pro- 
grammen jeder Arbeitsschritt mit einem Sound versehen wird, der sich 
deutlich am Arsenal von Cartoons orientiert, dann ist das ein Indiz dafür, 
dass die Stereotype der Tonspur nicht ohne Auswirkung auf Erwartun- 
gen der auditiven Alltagswahrnehmung bleiben. Ein weiteres Indiz dafür 
sind verschiedene Berichte über ein Fehlverhalten von Zeugen bei Schuss- 
wechseln: Aufgrund ihrer Erwartung des satten bassigen Schussgeräuschs 
aus dem Kino identifizieren sie tatsächliche Schüsse als Hämmern oder 
Möbelverschieben. Laut Mott (1990: 76) haben aufgeplusterte Toneffekte 
in der Werbung bei den Konsumenten so ausgeprägte Enttäuschungen 
ausgelöst, dass die Federal Communications Commission und die Truth In 
Advertising Authorities diese Form der akustischen Irreführung verboten 
haben. 

Damit sind wir wieder bei der ursprünglichen Konzeption von Lipp- 
mann, welcher die vermittelte Erfahrung der Welt durch eine wie auch 
immer gestaltete Überlieferung als eine Grundvoraussetzung der Stereo- 
typgenese anschaut. 

Die Entstehungsgeschichte einiger Stereotype lässt sich anhand 
des Korpus deutlich verfolgen. Die erwähnte Metalltür — aufgrund 
ihres obligatorischen Erscheinens in kerkerhaften Settings ohne Wei- 
teres als Stereotyp zu klassifizieren — wird ja bereits in THE Bic HOUSE 
(USA 1931, George Hill) eingesetzt und bleibt bis heute erhalten. Bei 
Action-, Science-Fiction- und Monster-Filmen wird sie signifikant hau- 
figer auch in anderen Settings eingesetzt. In Biopics wie RAGING BULL 
(USA 1980, Martin Scorsese, 1.49.09-1.52.11) oder MALCOLM X (USA 
1991, Spike Lee) hingegen bleibt sie ausschließlich dem Gefängnis vor- 
behalten. Der nachhaltige Bestand dieses Klangobjekts geht sowohl auf 
den symbolischen Hintergrund der Tür zurück als auch auf die per- 
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zeptive Auffälligkeit der Vergrößerung und Intensivierung durch die 
materielle Ausgestaltung in Metall, das imposante Volumen und den 
bassigen Klang. 

Die zischende automatische Tür ist hingegen zunächst nur in der 
STAR Wars-Trilogie vorhanden, taucht also 1977 im Korpus erstmals auf. 
Später wird sie auch in E. T. — THE EXTRATERRESTRIAL (USA 1982, Steven 
Spielberg), 48 Hrs. (USA 1983, Walter Hill), TERMINATOR 2 (USA 1992, 
James Cameron), JURASSIC PARK (USA 1993, Steven Spielberg) vorkom- 
men, nicht jedoch in dem artverwandten ALIENS — THE RETURN (USA 
1986, James Cameron), wo die automatischen Türen röhren und don- 
nern, oder in den STAR TREK-Filmen, die klangästhetisch viel deutlicher 
an die Science-Fiction-Filme der 1950er-Jahre anschließen. In gewisser 
Weise unterscheiden sich diese Produkte im Sinn einer Branding-Stra- 
tegie voneinander, das heißt, die Filme sollen sich als Markenprodukte 
mit einem spezifischen Image an ein eingeschworenes Zielpublikum 
wenden. 

Sound Designer, die einen höheren Anspruch verfolgen, werden 
nur dort, wo es unmittelbar zum automatisierten Bedeutungstransfer 
beiträgt, zum reinen Stereotyp aus dem Geräuscharchiv greifen. Viel 
häufiger gehen sie von der genauen Kenntnis eines Stereotyps aus, das 
sie zwar aufgreifen, dann aber subtil modifizieren, wie Frank Warner das 
Klangobjekt Faustschlag für die Filme Rocky II (USA 1979, Sylvester Stal- 
lone) und Racinc BuLr (USA 1980, Martin Scorsese). Faustschläge gehö- 
ren zu jenem Typus von Klangobjekten, die wir primär über die mediale 
Vermittlung erfahren. Wie Burtt (in LoBrutto 1994: 140) meint, geht die 
intertextuelle Evolution des Faustschlags auf die frühesten Tage des 
Films zurück. Dieses Klangobjekt musste von Beginn an nachsynchroni- 
siert werden, weil sich die Schauspieler nicht wirklich geschlagen haben. 
Als besonders erfolgreich haben sich die Faustschläge von Warner Bro- 
thers und Paramount erwiesen, die sich darüber zu Stereotypen entwi- 
ckelt haben. In SAN Francisco (USA 1936, W.S. Van Dyke) ist noch ein 
nicht standardisierter, kläglich wirkender Faustschlag zu hören. 

Warners Faustschläge in RAGING BuLL kommen nicht nur den 
Erwartungen des Publikums an einen satten, wuchtigen Faustschlag 
entgegen, sondern geben darüber hinaus minutiöse körperliche Verän- 
derungen wieder, die so wohl mit der subjektiven psychischen Verfas- 
sung des Protagonisten als auch mit dem physischen Zustand des Geg- 
ners korrelieren. Jeder Faustschlag war ein Unikat, zusammengesetzt 
aus mehr als zehn verschiedenen Klangelementen (Warner in LoBrutto 
1994: 34). Dieses Verfahren wendet Warner speziell in den Kampfszenen 
auch auf die anderen Stereotype der Tonspur an, dazu gehören die Blitz- 
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lichter, die als Stereotype des Biopics den öffentlichen Status der Prota- 
gonisten widerspiegeln, sowie die Glocken als Signale fiir den Beginn 
der Boxkämpfe. 


Leitmotive 


Der Begriff Leitmotiv wurde von Richard Wagner Mitte des 19. Jahrhun- 
derts entwickelt. In Kurzform meint er 


eine Tonfolge, welche innerhalb eines Musikstiickes eine oder mehrere Per- 
sonen, Ereignisse, Situationen, Gegenstande charakterisieren soll. Leitmotive 
sind wahrend eines musikalischen Ablaufs variierbar. Die jeweiligen Veran- 
derungen eines Leitmotivs symbolisieren die Entwicklungen und Wandlun- 
gen einer Bezugsgröße. (Neubauer 1994: 178) 


Wagner hatte 1851 in seiner neuen Theorie der Oper als Musikdrama das 
Leitmotiv als strukturierendes Element konzipiert. Ausgehend von der 
Funktion des Chors im antiken Drama wollte er dem Orchester eine abs- 
trakt-symbolhafte Kommentarfunktion tibertragen, welche die Hinter- 
gründe des Geschehens, die seelische Verfassung der Figuren und die 
metaphysische Dimension des Schicksals ausdrtickt. 

Wahrend der Stummfilmzeit griff die Filmmusik auf die Technik des 
Leitmotivs, um komplexere Entwicklungszusammenhänge zu etablieren. 
Als einer der wichtigsten klassischen Verfechter dieses Verfahrens gilt Max 
Steiner, der sämtliche seiner Kompositionen auf diesem Gestaltungsprinzip 
aufbaute: von Kinc Kong (USA 1933, Cooper; Schoedsack) über GONE WITH 
THE WIND (USA 1939, Victor Fleming) bis CASABLANCA (USA 1942, Michael 
Curtiz). Steiner war der Uberzeugung, dass jeder Figur ein Motiv zugeordnet 
werden miisse, um die emotionale Partizipation der Zuschauer zu sichern. 

Schon in den 1940er-Jahren kritisierten Adorno und Eisler die infla- 
tionäre Verwendung des Leitmotivs unter einer primar erzählökonomi- 
schen Perspektive: 


Immer noch wird die Kinomusik durch Leitmotive zusammengekleistert. 
Während ihr Erinnerungswert dem Betrachter handfeste Direktiven gibt, ma- 
chen sie es zugleich dem Komponisten in der Hast der Produktion leichter: er 
kann zitieren, wo er sonst erfinden müsste. (Adorno/Eisler 1944: 15) 


Die Kritik Adorno/Eislers, seither ihrerseits häufig kritisiert, verdient es, 
genauer unter die Lupe genommen zu werden, weil dabei einige Unschär- 
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fen der theoretischen Beschäftigung mit dem filmmusikalischen Leitmotiv 
deutlich werden. 

Die Autoren meinen, dass Leitmotive auch in ihrer ursprünglichen 
Konzeption schon zur Vereinfachung der Rezeption gedient hätten: «Sie 
waren immer das gröbste Mittel zur Verdeutlichung, der «rote Faden» für 
musikalisch nicht Vorgebildete» (Adorno/Eisler 1944: 15). Die einfache 
Integration der Leitmotivtechnik in die Filmkomposition sei aber illu- 
sionär. 


Der Bausteincharakter des Leitmotivs, seine Prägnanz und Kürze, stand von 
vornherein in Relation zu der Größe der musikalischen Form der riesigen 
Musikdramen der Wagnerschen und nach-Wagnerschen-Ara. Gerade weil 
das Leitmotiv fiir sich musikalisch noch nicht entfaltet ist, verlangt es, um 
kompositorisch einen Sinn zu geben, der mehr als seine bloße Anzeigefunk- 
tion ist, nach breiten musikalischen Flachen. Der Atomisierung des Materials 
entspricht die Monumentalitat des Baus. (Adorno/Eisler 1944: 15) 


Weder diese Flächen noch die Monumentalität des Baus könne die Film- 
musik bieten, die selbst schon fragmentiert sei und deswegen weder der 
Verkehrslichter des Leitmotivs bedürfe noch in der Lage sei, es angemessen 
auszubreiten. 

Der Kern- und Angelpunkt ihrer Kritik betrifft jedoch die Trivialisie- 
rung der ästhetischen Funktion des Leitmotivs in der Filmgestaltung: 


Das Wagnersche Leitmotiv ist unabtrennbar verbunden mit der Vorstellung 
vom symbolischen Wesen des Musikdramas. Das Leitmotiv soll nicht ein- 
fach Personen, Emotionen oder Dinge charakterisieren — obwohl es weithin 
immer so aufgefasst worden ist —, sondern es soll im Sinn der eigentlichen 
Wagnerschen Konzeption die szenischen Vorgänge in die Sphäre des meta- 
physisch Bedeutenden erheben. Wenn im Ring das Walhallamotiv in den 
Tuben ertönt, so soll es nicht einfach Wotans residence anmelden, sondern 
Wagner wollte damit die Sphäre des Erhabenen, des Weltwillens, des Ur- 
prinzips ausdrücken. [...] Im Film, der sich die genaue Abbildung der Wirk- 
lichkeit vorsetzt, ist für solche Symbolik kein Raum mehr. Die Leistung des 
Leitmotivs reduziert sich auf die eines musikalischen Kammerdieners, der 
seinen Herrn mit bedeutsamer Miene vorstellt, während den Prominenten 
ohnehin jeder erkennt. (Adorno/Eisler 1944: 16) 


Mit ihrer Kritik meinen Adorno/Eisler also vor allem jene Kompositions- 
praktiken, die sich darauf beschränken, in einfacher Wiederholung Per- 
sonen oder Orte mit Melodien zu etikettieren, ohne außerdem über die 
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Interaktion zwischen Ton und Bild einen höheren — metaphysischen oder 
symbolischen — Abstraktionsgrad zu erreichen oder auch nur anzustre- 
ben. Damit geifseln sie zwar eine weitverbreitete Praxis, ihrer Annahme 
jedoch, dass die Problematik grundlegender Natur sei, der Film als ikoni- 
sche Repräsentationsform grundsätzlich keine übergeordneten Strukturen 
bilden könne, muss auf jeden Fall widersprochen werden. Anhand der 
detaillierteren Analyse einiger Beispiele wird sich mühelos zeigen lassen, 
dass besonders in der Anforderung zur komplexen Vernetzung referen- 
zieller und abstrakter Bedeutungen der größte Gewinn für eine überzeu- 
gende dramatische Struktur des Films liegen kann.° 

Als wichtige Hinweise für die Begriffsbestimmung des Leitmotivs 
gehen aus Adorno/Eislers Kritik zwei Aspekte hervor: Es handelt sich 
beim Leitmotiv um einen Mechanismus zur dynamischen Symbolkons- 
truktion innerhalb des Werks und gleichzeitig um ein strukturbildendes 
übergeordnetes Prinzip. In einer Art Negativdefinition scheidet daher die 
oben geschilderte reine Anzeigefunktion aus, welche Adorno/ Eisler als 
«Kammerdiener» bezeichnen. 

Nur hat auch diese eingeschränkte Funktion ihren Platz in der Film- 
gestaltung. Wie im Abschnitt Stereotype (> 176) dargestellt, kann es durch- 
aus sinnvoll sein, gewisse Informationen so aufzubereiten, dass sie auto- 
matisiert und damit ökonomisch und weitgehend unterschwellig rezipiert 
werden können. 

Eine weitere terminologische Unschärfe ergibt sich aus dem synony- 
men Gebrauch der Begriffe Motiv und Thema, welche die Musiktheorie 
voneinander unterscheidet, in weiten Teilender filmtheoretischen Dar- 
stellung. 


Unter Motiv (movere = bewegen) versteht man die kleinste selbstständige 
und charakteristische melodische Bewegungseinheit. Es ist die «einzelne Ge- 
bärde des musikalischen Affektes» (Fr. Nietzsche). Es gibt den entscheiden- 
den Bewegungsimpuls für den weiteren Verlauf. 

Thema ist ein in sich geschlossener musikalischer Gedanke in prägnanter 
charakteristischer Ausdrucksgestaltung, das erste formal abgerundete Ergeb- 
nis des motivischen Impulses. (Grabner 1923: 165) 


Das Motiv ist also ein Baustein des Themas. Das hat Konsequenzen für die 
Leitmotivtechnik. Verschiedene Leitmotive könnennämlich nebeneinan- 
der in ein Thema integriert werden, um neue Beziehungen zu schaffen. Es 


6 Sehr überzeugend setzt auch Brown (1994: 97) dieses Postulat in einer Modellanalyse 
von Erich Wolfgang Korngolds Komposition zu THE SEA Hawk (USA 1940, Michael 
Curtiz) um, in dem er die verschiedenen Bezüge exakt herausarbeitet. 
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geht ja — wie Eisler und Adorno schreiben - in der ursprünglichen Konzep- 
tion gerade um die Integration solch kleinräumiger Motive in einen groß 
angelegten Überbau. 

Während Wagner für die Übertragung einer denotativen Bedeutung 
auf das musikalische Motiv die Verankerung in der Versmelodie forderte, 
also auf die gleichzeitige verbale und musikalische Darbietung aufbaute, 
sind im Film andere Formen der Anbindung möglich, in erster Linie natür- 
lich die Anbindung an die optische Repräsentation.” 

Für das Gelingen der Bedeutungsübertragung ist das erste Auftreten 
des Leitmotivs entscheidend. Es muss strategisch so platziert sein, dass 
eine auffällige und eindeutige Interaktion zwischen Ton und Bild stattfin- 
det. Die Kognitionspsychologie stellt dafür den Begriff Priming zur Ver- 
fügung. Priming bedeutet Voraktivierung der Aufmerksamkeit. Durch das 
Priming wird ein bestimmtes semantisches Register, ein Bedeutungsfeld, 
geöffnet, an welches nachfolgende Informationen angepasst werden. Bild- 
lich könnte man auch von einer Schiene sprechen, welche eine bestimmte 
Richtung vorgibt, die später lediglich ausgebaut werden kann. Ob die 
symbolische Bedeutung zum Beispiel mit Tod, Gefahr oder Glück assozi- 
iert wird, legt die allererste Exposition fest. 

Die Bedeutung des Leitmotivs muss gelernt werden, und zwar han- 
delt es sich dabei in den meisten Fällen um ein implizites, unbewusstes 
Lernen. Die Rezipienten müssen ein Regelsystem oder eine abstrakte 
Struktur von Reizen erwerben, «ohne absichtlich nach Regeln zu suchen 
und ohne dass ihnen die Regeln bewusst werden» (Goschke 1996: 392). 
Ist nach dem Priming ein erster Bedeutungsgehalt etabliert, muss er über 
die wiederholte Assoziation weiter genährt und im Gedächtnis verankert 
werden, bis die Verbindung so stabil ist, dass das musikalische Motiv oder 
das Klangobjekt allein den assoziativen Komplex repräsentieren kann. 
Wiederholung ist somit ein obligatorisches Element für die Bildung eines 
Leitmotivs. Wie Meyer (1956) darstellt, muss Wiederholung aus psycholo- 
gischer Sicht als dynamisch aufgefasst werden: 


Wir revidieren unsere Ansicht dessen, was in der Vergangenheit passiert ist, 
ständig aufgrund von gegenwärtigen Ereignissen. Das heißt, dass wir unsere 
Erwartungen ebenfalls ständig verändern, und bedeutet gleichzeitig, dass 


7 «{...] obwohl Musik an sich nicht referenziell ist, kann das wiederholte Auftreten eines 
musikalischen Motivs im Zusammenhang mit referenziellen Elementen eines Films 
(Bild, Sprache) dazu führen, dass die Musik ebenfalls referenzielle Bedeutung trägt» 
(Gorbman 1987: 26). 

(«[...] although music is in itself nonrepresentational, the repeated occurrence of a 
musical motif in conjunction with representational elements in a film (image, speech) 
can cause the music to carry representational meaning as well.») 
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Wiederholung, auch wenn sie physikalisch gesehen existiert, im psychologi- 
schen Sinn nicht vorkommt.’ (Meyer 1956: 49) 


Wo immer das Leitmotiv erklingt, schlägt es eine Brücke zwischen dem 
Gegenwärtigen und dem Vergangenen. Obwohl in der Zeit angesiedelt, 
entwickelt es eine zeitlose Struktur im Gedächtnis des Rezipienten, eine 
Achse, auf welcher er sich vor- und zurückbewegen kann. Der Inhalt 
des Gedächtnisses bleibt allerdings plastisch und passt sich immer 
wieder neu den aktuellen Umständen an. Im Leitmotiv findet ein Ver- 
schmelzungsprozess statt, in welchem sich die vergangenen und gegen- 
wärtigen Kontexte anreichern. Für den Rezipienten ist der «Struktur- 
bildungsprozessreversibel, d.h., er kann auch rekapitulieren, aufgrund 
welcher Ursachen die Wirkungen zustande gekommen sind» (Wuss 
1993: 111). 

Können Klangobjekte Leitmotive sein? In der ursprünglichen, musi- 
kalischen Konzeption waren natürliche Geräusche als Leitmotive nicht 
vorgesehen. Schon im Barock hat die Musik jedoch durch Imitation von 
natürlichen Geräuschen einen referenziellen Bezug zur außermusikali- 
schen Wirklichkeit geschaffen, berühmt sind Le quattro stagioni von Vivaldi. 
Signale wie das Jagdhorn oder die Fanfaren, Tier- und insbesondere Vogel- 
stimmen, Naturgeräusche wie Donner und Blitz haben als Tonmalereien 
Eingang in die musikalische Komposition gefunden.’ Der Unterschied 
zum Original-Leitmotiv besteht darin, dass das Klangobjekt oder dessen 
Imitation eine vorgeformte Bedeutung symbolischer oder referenzieller 
Art in einen narrativen oder visuellen Kontext einbringt, dessen Bedeu- 
tung sich in der Interaktion mit diesem Kontext durch Wiederholung wan- 
delt. Die Beziehung ist demnach reziprok. Zwei Bedeutungen formieren 
auf einer höheren Abstraktionsebene ein Superzeichen, welches sich über 
die wiederholte Exposition dynamisch entwickelt. Damit sind alle Anfor- 
derungen an ein Leitmotiv abgedeckt: der Erwerb einer abstrakten symbo- 
lischen Bedeutung, die zunehmende Autonomie - das Klangobjekt allein 
kann den symbolischen Komplex repräsentieren- und die Bildung einer 
übergeordneten dramatischen Struktur. 

In THE PLAYER gibt es ein schönes Beispiel für die leitmotivische Ver- 
wendung eines Geräuschs. Ein unspezifisches Klappern wird beim ersten 
Auftreten einer der erpresserischen Postkarten hörbar, mit denen der Pro- 


8 «[...] we are constantly revising our opinions of what has happened in the past in the 
light of present events, [that] means that we are continually altering our expectations. It 
means [...]that repetition, though it may exist physically, never exists psychologically.» 

9 Viele dieser Tonmalereien werden im Theater seit der Antike verwendet und haben 
darüber hinaus eine symbolische Bedeutung (> Verfremdung 277, Donner 356) 
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duzent Griffin Mill von einem vernachlässigten Autor gejagt wird, und 
lädt sich so mit der Bedeutung auf, die mit diesen Karten verbunden ist 
(Abb. 9). 

Wichtig im Sinne eines Primings ist die Verbindung des Klapperns 
mit der ausschnitthaften, verdichteten Darstellung des Objekts in Detail- 
aufnahme, welche die Aufmerksamkeit des Zuschauers gezielt fokussiert. 
Unterstützend verblassen auf der Tonspur zeitgleich die übrigen Geräu- 
sche, sodass das Klappern relativ isoliert dasteht und eindeutig der Post- 
karte zugeordnet werden kann. 

Ein zweites Mal erklingt das Klappern zu einem Insert, einem Plakat- 
ausschnitt mit der Aufschrift «Highly Dangerous» (Abb. 10). 

Erst nach der Hälfte des Films wird dieses Geräusch einer natürlichen 
Quelle zugeordnet, einer Klapperschlange, und überträgt nun seinerseits 
die erworbene Bedeutung Erpressung — Gefahr auf diese Quelle (Abb. 11 
und 12). 

Sie wird damit nicht nur dinglich-konkret - bis zu diesem Zeitpunkt 
war das Klangobjekt nämlich keiner natürlichen Quelle zugeordnet -, 
sondern erhält durch das Bild der Schlange eine zusätzliche symbolische 
Dimension, die im Repertoire der Zuschauer fest verankert ist. 
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Von dieser reziproken Entladung geht eine große expressive Energie 
aus, welche die weitere narrative Entwicklung, oder besser die Wahrneh- 
mung dieser narrativen Entwicklung, maßgeblich beeinflusst. 

Wenn der süffisante Schürzenjäger Vicomte de Valmont in DANGE- 
Rous LIAISONS (USA 1988, Stephen Frears) mehrfach mit dem Brunftschrei 
einer Katze assoziiert wird, so entsteht zwar eine symbolische Aussage 
durch die metaphorische Übertragung von Tiereigenschaften - in diesem 
Fall die triebhafte sexuelle Begierde - auf die Figur. Im strikten Sinn han- 
delt es sich jedoch nicht um ein Leitmotiv, weil der wichtige Aspekt der 
dynamischen Konstruktion wegfällt. Das heißt, es wird nicht innerhalb 
des Films eine neue spezifische Symboldimension konstruiert, sondern 
ein bestehendes Konzept lediglich durch mehrfache Wiederholung einer 
Figur zugeordnet. Im Licht von Meyers Aussage zur genuin dynamischen 
Gestalt von Wiederholungen aus psychologischer Sicht (> 187) reichert 
der Rezipient das wiederkehrende Motiv dennoch mit dem jeweils aktuel- 
len Kontext seines Erscheinens an, und so kann das Miauen am Ende eine 
andere Bedeutung haben als zu Beginn des Films. 


III Klanglichkeit der Tonspur 


6 Frequenz 


Psychophysische Grundlagen des Hörens 


Die Psychophysiologie befasst sich mit Vorgängen, die sowohl psychologi- 
scher als auch physiologischer Methodik zugänglich sind. Zunächst wurde 
sie als Lehre von den Beziehungen zwischen Leib und Seele verstanden. 
Ihre Prämisse war die Annahme, dass jedem Zustand des Bewusstseins 
ein materieller Vorgang, ein sogenannter psychophysischer Prozess, 
zugrunde liegt. Als Teilgebiet dieser wissenschaftlichen Disziplin kann die 
Psychoakustik aufgefasst werden. 

Die psychoakustischen Untersuchungen haben sich während der 
letzten hundert Jahre vorwiegend mit sehr reduzierten Fragestellungen 
befasst. Zunächst ging es darum, gewisse Grundlagen für das Verstehen 
des Hörens zu schaffen. Mit einem monokausalen, vorwiegend natur- 
wissenschaftlichen Verständnis haben sie das Verhältnis zwischen Reiz 
und Empfindung untersucht und dabei eine fundamentale Beziehung 
zwischen Reizänderung und Empfindungsänderung beobachtet. Auf 
dieser Annahme beruhten bis in die jüngste Vergangenheit die meisten 
psychophysischen Untersuchungsmethoden. Erst in den letzten 20 bis 25 
Jahren haben Forscher diesen Stimulus-Response-Ansatz mehr und mehr 
infrage gestellt. Zuerst haben vor allem die Musikpsychologen komple- 
xere Zusammenhänge zwischen akustischer Produktion und auditiver 
Wahrnehmung untersucht. Auch sie arbeiteten im Namen des vorherr- 
schenden Wissenschaftspositivismus mit vorwiegend empirischen Metho- 
den, deren wichtigster Vorteil darin gesehen wurde, dass sie wissenschaft- 
lich abgestützte Resultate lieferten. 

Vergleicht man diese Publikationen, die Ende der 1960er-, Anfang 
der 1970er-Jahre erschienen sind, mit Untersuchungen neueren Datums, 
so fällt auf, dass man heute Ergebnisse, die damals als gesichert galten, 
wieder infrage stellt. Wissenschaftler — so könnte man daraus schließen — 
sind wieder bescheidener und vorsichtiger geworden. Die Wissenschafts- 
euphorie der 1970er-Jahre, die wir im Zusammenhang mit der explosiven 
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Entwicklung technischer Innovationen — besonders der Datenverarbei- 
tung — sehen können, hat einem wissenschaftlichen Selbstverständnis 
Platz gemacht, das offene Fragen durchaus zulässt und deshalb auch ein 
offenes Ohr für komplexere Zusammenhänge bekommen hat. Bateson 
beschreibt seine Skepsis gegenüber den reinen Reiz-Reaktions-Zusam- 
menhängen, wie sie von der Psychophysik weitgehend postuliert werden, 
mit einem witzigen Gleichnis: 


Wenn ich gegen einen Stein trete, wird die Bewegung des Steins durch die 
Handlung mit Energie gespeist, trete ich aber einen Hund, so kann das Ver- 
halten des Hundes in der Tat teilweise energieerhaltend sein — er kann eine 
Newtonsche Flugbahn beschreiben, wenn ich fest genug trete, aber das ist 
bloße Physik. Entscheidend ist, dass er Reaktionen zeigen kann, die nicht 
durch den Tritt, sondern durch seinen Stoffwechsel mit Energie gespeist wer- 
den; er kann sich umdrehen und beißen. (Bateson 1972: 302) 


Das Ohr 


Das menschliche Ohr ist auf die energetischen Emissionen jener mechani- 
schen Schwingungen im Frequenzbereich zwischen 20 und 20.000 Hz aus- 
gelegt, die unter dem Oberbegriff Schall zusammengefasst werden. Schall 
braucht ein Medium, um sich auszubreiten. Dieses Medium kann sich in 
festem, gasförmigem oder flüssigem Aggregatzustand befinden. Auf der 
Erde handelt es sich dabei hauptsächlich um Luft und in zweiter Linie 
um Wasser. Die Moleküle des Mediums werden durch die Anregung in 
Schwingung versetzt. 

In der Luft äußern sich diese molekularen Bewegungen als Dichte- 
schwankungen, die als Luftdruckschwankungen messbar sind. Die dabei 
entstehenden Bereiche von Verdichtung und Verdünnung breiten sich als 
Schallwellen aus. Die Moleküle bleiben im Mittel an Ort. Sie schwingen 
um ihre Ruhelage herum, wobei in Luft diese Pendelbewegung in der 
Ausbreitungsrichtung der Welle erfolgt. Luftschall breitet sich damit in 
sogenannten Longitudinalwellen aus. 

Das Ohr weist eine Reihe von rekordverdächtigen Fähigkeiten auf: 
Der Frequenzumfang von 20 bis 20.000 Hz, der als adäquater Reiz vom 
Gehör verarbeitet werden kann, beträgt zehn Oktaven und ist damit zehn- 
mal größer als der Wahrnehmungsbereich des Auges, der eine Frequenz- 
verdoppelung umfasst. Dieselben Superlative gelten für die Empfindlich- 
keit des Gehörs. Zwischen dem kleinsten Schalldruck, den das Ohr gerade 
noch weiterleiten kann, und dem größten an der Schmerzgrenze besteht 
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ein Verhältnis von eins zu einer Million. Ein gerade noch hörbarer Ton 
bewirkt eine Auslenkung des Trommelfells in der Dimension eines Was- 
serstoffmoleküls. Die kürzesten informativen Zeiten, die das Ohr verarbei- 
ten kann, liegen im Bereich von 10° Sekunden (Plattig 1975). 

Die Grenzen und Möglichkeiten des Ohrs sind eng an seinen ana- 
tomischen Aufbau gebunden und unterscheiden sich deutlich von den- 
jenigen der elektrischen Schallwandler: der Mikrofone. Dieser Umstand 
war bereits für die abbildungstheoretischen Überlegungen zum Filmton 
(> 90) von Bedeutung, und ich werde im Kapitel Wahrnehmung komplexer 
akustischer Muster (> 244) darauf zurückkommen. 

Das Ohr (Abb. 13) besteht aus den drei Teilen Außenohr, Mittelohr und 
Innenohr. Die folgende Grafik verdeutlicht die Bereiche und ihre Arbeits- 
prinzipien. Das äußere Ohr bündelt die Schallwellen und verstärkt sie 
um 10 bis 15 dB. Die Schwingungen des Trommelfells werden von den 
drei winzig kleinen Gehörknöchelchen Hammer, Amboss und Steigbügel im 
mittleren Ohr mechanisch auf das sogenannte ovale Fenster übertragen, das 
sich zwischen Mittel- und Innenohr befindet. 

Die Eustachische Röhre verbindet das Mittelohr mit dem Rachenraum 
und sorgt für Druckausgleich. Zwei sehr kleine Muskeln können die Lage 
des Steigbügels und die Spannung des Trommelfells in geringem Umfang 
verändern. Das Innenohr besteht aus zwei Teilen: aus der Cochlea oder 
Ohrschnecke und aus dem vestibulären System, dem Gleichgewichtsorgan. 
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Die eigentliche auditive Informationsverarbeitung beginnt in der Cochlea, 
die in sich drei mit Flüssigkeit gefüllte Kanäle vereinigt. 

Das Verständnis für das Arbeitsprinzip dieses winzigen Organs geht 
auf das Lebenswerk eines einzelnen Menschen, des ungarisch-amerikani- 
schen Nobelpreisträgers Georg von Békésy (1899-1972) zurück. Er konnte 
nachweisen, dass sich die vom ovalen Fenster an die Cochlea weiterge- 
leiteten Schwingungen dort in Form einer Wanderwelle fortpflanzen, um 
sich schließlich am runden Fenster aufzulösen. Die Wanderwelle brandet 
wie ein kleiner Ozean in den einen Kanal der Ohrschnecke, die sogenannte 
Scala tympani, hinein und führt zu einer Frequenzdispersion; das heißt, 
hohe Töne werden an der Basis der Cochlea und mit abnehmender Fre- 
quenz zum inneren Ende hin wirksam. 

Die Wanderwelle versetzt die Basilarmembran in Schwingung, wel- 
che die Scala tympani von der Scala media, dem mittleren der drei Kanäle, 
trennt. Auf der Basilarmembran sitzt das Cortische Organ mit den eigent- 
lichen Rezeptorzellen, die sich in innere und äußere Haarzellen aufteilen. 
Die Haarzellen werden je nach Auslenkung der Basilarmembran durch 
Verbiegung aktiviert und geben elektrische Impulse an die Nervenfasern 
ab. Die äußeren Haarzellen sind außerdem nicht nur Rezeptoren, sondern 
auch Effektoren, die aktiv Schwingungen produzieren, um frequenzspezi- 
fisch einzelne Schallanteile zu verstärken oder sogar zusätzliche Oberwel- 
len zu erzeugen (Schneider 1997: 82). Die Tätigkeit dieser Effektoren lässt 
sich als sogenannte otoakustische Emission im Gehörgang messen. Das Ohr 
ist somit nicht nur ein passiver Empfänger, sondern gleichzeitig aktiv an 
der optimalen Aufbereitung der Reizeigenschaften beteiligt. «Zur Wahr- 
nehmung im engeren Sinne rechnen deshalb gerade auch solche Eindrü- 
cke, die zwar auf einer physikalischen Basis entstehen und durch diese 
primär hervorgerufen werden, nicht aber auf die Abbildung physikali- 
scher Parameter allein reduzibel sind» (Schneider 1997: 82). 

Die Hauptarbeit der Reizprozessierung geschieht jedoch in den 
nachgeschalteten Analyseapparaten des Gehirns. Räumliches Hören, die 
Unterscheidung von Schallintensitäten und Tonhöhen, die Integration ver- 
schiedener Schallereignisse zu Melodien und Sprache sowie die auditive 
Objektwahrnehmung vollzieht sich auf den unterschiedlichen Stufen der 
neuronalen Informationsverarbeitung im Gehirn. «Heute wird der Prozess 
des Hörens als ein strukturierender, bedeutungsgenerierender Vorgang 
angesehen, bei dem Ohr und Gehirn zusammen aktiv die Hörempfindung 
hervorbringen» (Walkowiak 1996: 209). Der neuroanatomische Aufbau 
der Hörbahn ist nur teilweise für das weitere Verständnis dieser Arbeit 
notwendig. Umfassendere Einführungen finden sich in Zenner (1993: 
305 ff.) oder bei Walkowiak (1996: 208 ff.). Von unmittelbarer Bedeutung 
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für die Rolle des Hörens während der Filmrezeption sind jedoch folgende 
Befunde: 


1 


Ganzheitliche Reizverarbeitung 

Als wichtigste spezifische Grundlage der auditiven Wahrnehmung ist 
die Integration verschiedener Decodierungsverfahren zu nennen (Wal- 
kowiak 1996: 224f.). Vereinfacht gesagt, bedeutet dies, dass sämtliche 
Parameter des Schalls - Intensität, Frequenz und zeitliche Struktur — 
miteinander interagieren und deshalb ganzheitlich wahrgenommen 
werden. Erst über den Vergleich der Entladungsmuster einer Gruppe 
oder eines Ensembles von Fasern wird es möglich, die relevanten Para- 
meter aus dem Schallgemisch zu isolieren und für die Informationsver- 
arbeitung zugänglich zu machen. Klangobjekte sind multidimensional. 
Winckel (1961: 63) bemerkt, dass «das bekannte räumliche Modell mit 
den drei Koordinaten Zeit, Frequenz und Lautstärke nicht ausreicht, 
um Einzelklänge darzustellen, denn dessen Wände müssten elastisch 
sein». Berendt (1985: 82) formuliert das sehr schön: «Musik findet nicht 
nur in der Zeit statt, sie überhöht und überwindet Zeit. Nicht nur Ver- 
gangenheit und Gegenwart verschmelzen, auch Zukunft fällt in sie hi- 
nein - insofern, als in den harmonischen Abläufen der Musik der jetzt 
erklingende Ton den künftigen, indem er sich auflöst, antizipiert». Au- 
riol (1991: 197) schwingt sich zu poetischen Höhen empor: «Die Zeit ist 
aufgebrochen und das Universum verweht...»! 


Filterung 

Die Nervenbahnen transferieren nur einen geringen Teil des akustischen 
Reizes, den sogenannten Nutzschall, zu den höheren Zentren der Schall- 
verarbeitung im Kortex (Zenner 1993: 326). Die nicht relevanten Anteile 
werden durch inhibitorische, das heißt, hemmende Prozesse bereits auf 
den niederen Stufen ausgefiltert. Efferente, das heifst, absteigende Neuro- 
nen, die von den höheren Zentren gesteuert werden, lösen solche inhibi- 
torische Prozesse aus. Hören ist demnach kein linearer Reiz-Reaktions- 
Prozess, sondern ein hochkomplexer kybernetischer Regelkreis. Es steht 
immer im Zusammenhang mit der psychischen Disposition des Subjekts, 
mit Aspekten der individuellen Wertung und mit motivationalen Zustän- 
den, welche die auditive Aufmerksamkeit beeinflussen. Dieser Befund ist 
insbesondere für das Thema Aufmerksamkeit und Selektion (> 244) von 
Bedeutung, das im Zusammenhang mit der strukturellen Anordnung 
verschiedenster Klangobjekte auf der Tonspur diskutiert werden muss. 


«Le temps s'est cassé et l'univers se brise ...» 
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° Die Verteilung der Gehöreindrücke in der Hörrinde 
Läsionen im Bereich der primären Hörfelder führen zu einer echten 
Taubheit, während Läsionen in den sekundären Hörfeldern, den Gyri 
temporales superiores und mediales, zu einer sogenannten Seelentaubheit 
führen, das heift, den Betroffenen fehlt das Verständnis für den emo- 
tionalen Gehalt des Gehörten. 


° Die laterale Verarbeitung im Gehirn 

Entsprechend der klassischen Auffassung gibt es beim Menschen im 
Unterschied zum Tier eine Aufgabenteilung zwischen den beiden 
Hälften — den Hemisphären — des Großhirns (Birbaumer/Schmidt 1993: 
437 ff.; Auriol 1991: 121 ff.). Sie sind den sensorischen Apparaten über 
Kreuz zugeordnet, das heift, das linke Ohr projiziert hauptsächlich in 
die rechte und umgekehrt das rechte Ohr in die linke Gehirnhälfte. Die 
Aufgabenteilung zwischen den beiden Hemisphären wird zerebrale La- 
teralisation genannt. In Untersuchungen bei Patienten mit einseitigen 
Hirnläsionen oder durchtrenntem Corpus callosum — dem Balken, der 
die beiden Gehirnhälften miteinander verbindet - hat sich gezeigt, dass 
eine Reihe von Verhaltensleistungen bevorzugt von einer der beiden 
Gehirnhälften prozessiert wird. 

Dabei ist die linke Hemisphäre für die Sprachbedeutung, die mathe- 
matische Analyse, die Erinnerung an Sprache und andere vorwiegend 
analytische Vorgänge zuständig. In diesen Bereich der auditiven Infor- 
mationsverarbeitung fällt auch die Identifikation von natürlichen Ge- 
räuschen (Peretz 1993: 211). In einer Reihe von Untersuchungen mit 
der Methode des dichotischen Hörens, bei welcher Probanden über Kopf- 
hörer auf beide Ohren getrennte akustische Informationen zugespielt 
werden, hat sich ein Vorteil des rechten Ohrs für die Sprachprozessie- 
rung gezeigt, der in der Forschung als Right Ear Advantage (REA) be- 
zeichnet wird (Hoopen 1996: 121). Nicht nur der besondere Stellenwert 
der Sprache für die menschliche Kommunikation und das Denken, 
sondern auch die weitverbreitete Asymmetrie der Händigkeit — eine 
deutliche Mehrzahl aller Menschen in unterschiedlichen Gesellschaf- 
ten bevorzugt die rechte Hand - haben dazu geführt, dass die linke 
Hemisphäre als die dominante bezeichnet wird. 

Die rechte Hemisphäre verarbeitet die prosodischen, also melodiösen 
Elemente der Sprache, die Musik, den subjektiven Eindruck, das Bild, 
den Traum, die räumliche Wahrnehmung, also vorwiegend ganzheit- 
liche Phänomene. Tsunoda (in Petsche 1989: 94) konnte experimen- 
tell - in Analogie zur Sprachprozessierung - einen ähnlichen Vorteil 
des linken Ohrs für die Musikwahrnehmung feststellen. Während die 
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Sprache ein klar umrissenes Zentrum — das Wernicke-Areal - aktiviert, 
sind an der Musikwahrnehmung verschiedene Gehirnareale beteiligt 
(Petsche 1989: 100). In Untersuchungen mit Elektroenzephalogrammen 
hat sich gezeigt, dass die Verteilung der Aktivität im Kortex nicht nur 
vom Vorwissen der Probanden, sondern auch von der Beschaffenheit 
des musikalischen Materials abhängt (Petsche et al. 1989: 111 ff.). 

Laut Birbaumer/Schmidt (1993: 439) besteht zwischen den beiden He- 
misphären ein Unterschied hinsichtlich der Denkstrategien: «Während 
die rechte Hemisphare in Analogien, also in Ähnlichkeitsbeziehungen, 
denkt und «gestalthaft» das Ganze einer räumlichen oder visuellen 
Struktur zu erfassen sucht, ist die Informationsverarbeitung der linken 
auf die kausalen Interferenzen, Ursache-Wirkungs-Beziehungen und 
das Ausgleichen logischer Widersprüche konzentriert. Man spricht 
auch von analoger (rechts) vs. sequenzieller (links) Informationsver- 
arbeitung.» 

Diese Lateralisation ist nur teilweise erworben und kulturell gebun- 
den. Tsunoda (1973, in Auriol 1991) konnte beispielsweise nachweisen, 
dass man die japanische Sprache vorwiegend in der rechten Hemisphä- 
re verarbeitet, da ihre Bedeutung hauptsächlich durch die Vokale trans- 
portiert wird. Auriol (1991) und Birbaumer/Schmidt (1993), die sich 
umfassend mit der Lateralität des zentralen Nervensystems auseinan- 
dersetzen, meinen in Übereinstimmung, dass die Schulung des Ohrs 
mit einer Verschiebung der Lateralisation einhergeht. Probanden mit 
einem geschulten Gehör verarbeiten deshalb musikalische Strukturen 
gleichzeitig analytisch und ganzheitlich in sehr weit gestreuten Hirn- 
arealen beider Hemisphären. 

Neuere Untersuchungen, die mitbildgebenden Verfahren die Hirntätig- 
keit bei gesunden Probanden beobachten, zeigen, dass der Austausch 
zwischen den beiden Hirnhälften über das Corpus callosum sehr inten- 
siv ist, mithin an der Mehrzahl aller Informationsverarbeitungsprozes- 
se beide Hemisphären beteiligt sind. Wie Walkowiak (1996: 237) meint, 
«unterstützen jedoch auch sie die genannten Befunde, dass der rechten 
Hemisphäre eine führende Rolle bei der Musikwahrnehmung, insbe- 
sondere bei der Tonhöhen- und Klangfarbenunterscheidung sowie der 
Melodie-Erkennung, zukommt.» 

Für uns ist es von weitreichender Bedeutung, dass das Gehirn verschie- 
dene Arten von Gehöreindrücken unterschiedlich verarbeitet. Diese 
Beobachtung wird immer wieder aufscheinen und hat den Aufbau die- 
ser Arbeit entscheidend geprägt, denn sie liefert die neuropsychologi- 
sche Rechtfertigung zur getrennten Darstellung von semantischen und 
klanglichen Aspekten akustischer Ereignisse. 
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Frequenz ist eine physikalische Größe und bezeichnet die Anzahl Schwin- 
gungen einer Schallwelle pro Sekunde in Hertz (Hz). Diese Größe steht 
in einem messbaren Verhältnis zur subjektiven Empfindungsgröße der 
Tonhöhe (oder Tonheit), die in Mel ausgedrückt wird. Dabei entsprechen 
500 Mel der Tonhöhe eines 500-Hz-Tons (gemessen bei 40 dB oberhalb der 
Hörschwelle). Unterhalb 500 Hz entspricht die Tonhöhe in Mel linear der 
Frequenz in Hz; oberhalb dieses Bereichs steigt sie im Vergleich zur Fre- 
quenz langsamer an und wird mehr und mehr logarithmisch. Die Ton- 
höhenwahrnehmung ist nur in einem Bereich zwischen etwa 100Hz und 
5kHz genau (Buser/Imbert 1987: 36 £.). 

Hinsichtlich der Frequenzbestimmung bestehen häufig nur äußerst 
vage Vorstellungen. Die Grafik (Abb. 14) zeigt die musikalischen Tonwerte 
als Bezugsgröße. Ausgehend vom Stimmton a, der 1939 auf 440 Hz festge- 
legt wurde, ergibt sich die abgebildete Frequenz-Tonwert-Relation. 

Daraus wird ersichtlich, dass tiefe Töne einen Bereich von circa 20 bis 
250Hz abdecken, mittlere Töne einen Bereich zwischen 250 und 1.000Hz 
und hohe Töne einen Bereich zwischen 1.000 und 4.200Hz. Oberhalb von 
4.200 Hz sind keine Grundtöne mehr angesiedelt. 

Die folgende Grafik sophonischer Hörkurven (Abb. 15) befasst sich 
mit dem Hörfeld des menschlichen Ohrs und dem Zusammenhang zwi- 
schen Reiz und Empfindung bezogen auf die Dimensionen Schalldruck 
und Frequenz. Als Hörfeld bezeichnet man jenen Bereich der auditiven 
Wahrnehmung, in welchem ein akustisches Ereignis im auditiven System 
eine wahrnehmbare Empfindung auslöst. Als untere Grenzfrequenz zum 
Bereich des Infraschalls werden 16 Hz betrachtet, als oberste Grenze gelten 
20.000 Hz. Die Hörfähigkeit im oberen Frequenzbereich nimmt mit zuneh- 
mendem Alter ab. Die Grafik beschreibt eine wesentliche Eigenschaft des 
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menschlichen Gehörs. Spielt man Probanden Sinustöne mit einem kon- 
stanten Schalldruckpegel, aber wechselnden Frequenzen zu, empfinden 
sie die dargebotenen Töne als unterschiedlich laut. 

Dieser Zusammenhang zwischen physikalischem Schalldruck (auf 
der y-Achse in dB) und Lautstärkeempfindung (in Phon) in Abhängig- 
keit von der Frequenz (auf der x-Achse in Hz) geht aus den geschwunge- 
nen Kurven in der Grafik hervor. Dabei bezeichnen die einzelnen Kurven 
Werte gleicher Lautstärkeempfindung in Phon. Die gestrichelte Linie im 
unteren Bereich entspricht der Hörschwelle, die oberste Linie mit 130 Phon 
der Schmerzgrenze. Die Hörfelder für Sprache und für akustische Musik, 
die unverstärkt dargeboten wird, sind schraffiert eingezeichnet. Nur für 
1.000 Hz stimmen Schalldruck und Lautstärke überein. Am schwächsten 
ist die Empfindlichkeit im Bassbereich ausgebildet, unter 200 Hz ist eine 
deutliche Abnahme zu beobachten. 

Diese Kurven mögen auf den ersten Blick abstrakt wirken, für das 
Verständnis des menschlichen Hörens sind sie jedoch von entscheiden- 
der Bedeutung. Unter anderem geht daraus hervor, wie stark sich das 
Gehör auf die Sprachwahrnehmung spezialisiert hat. Der Bereich der 
größten Empfindlichkeit zwischen 3 und 5kHz entspricht nämlich einem 
Frequenzbereich, der für die Sprachverarbeitung wichtig ist. Diese soge- 
nannten Präsenzen der Sprache heben die Phoneme aus den Umgebungs- 
geräuschen hervor und tragen viel zur Verständlichkeit bei, die in den 
indoeuropäischen Sprachen zu einem großen Teil auf den Konsonanten 
beruht. 
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Für die Untersuchung des Filmtons, speziell für die abbildungs- 
theoretischen Überlegungen (> Elemente des Abbildungsprozesses 88), dis- 
kutiert habe, möchte ich an dieser Stelle darauf hinweisen, dass wir eine 
rein technische Pegelveränderung als Klangveränderung wahrnehmen, 
weil die relative Empfindlichkeit im Bassbereich bei höheren Pegeln grö- 
Ger ist, die Empfindlichkeit in den Höhen über 10 kHz jedoch abnimmt. 
Daraus geht hervor, dass ein Pegelzuwachs zu einer subjektiven Zunahme 
der Bässe führt. Die Schmerzgrenze liegt wegen der großen Empfind- 
lichkeit bei hohen Frequenzen um 2000 bis 6000 Hz wesentlich tiefer 
als bei den Bassfrequenzen (eine Einsicht, die man aufgrund der tägli- 
chen Erfahrung bestätigen kann). Diese Empfindlichkeit steht in einem 
direkten Zusammenhang zu Lautphobien, die Schafer (1977) überall auf 
der Welt festgestellt hat, wie sie zum Beispiel vom Bohrer des Zahnarz- 
tes oder dem Kratzen von Fingernägeln auf einer Wandtafel ausgelöst 
werden. 

Für die Analyse der ästhetischen Tonproduktion ist die Grafik iso- 
phonischer Hörkurven ein Segen, denn wie ich im Folgenden noch zei- 
gen werde, sind die Grenzbereiche des menschlichen Hörens besonders 
ansprechbar für extreme Wirkungen und werden im Mainstreamfilm des- 
halb immer dann aktiviert, wenn es darum geht, Spannung oder Unbeha- 
gen zu erzeugen oder auszudrücken. 

Sinustöne (> 42) mit einer einzigen Frequenz kommen nur im Ver- 
suchslabor vor. In Wirklichkeit setzen sich Klangobjekte immer aus meh- 
reren Komponenten zusammen. 

Entscheidend für die Tonhöhenempfindung eines harmonischen Klangs 
(complex tone) ist der Grundton. Der Grundton ist auch dann für die Ton- 
höhenempfindung verantwortlich, wenn er leiser als einzelne Teiltöne ist. 
Er wird sogar vom Gehör induziert, wenn er gar nicht vorhanden ist, zum 
Beispiel bei der Tonwiedergabe durch schlechte Lautsprecher (Dickreiter 
1979). Dieser Effekt wird im Sound Design gezielt genutzt. 

Auriol (1991: 99 f.) hat entsprechend der Verarbeitung in den beiden 
Hirnhälften zwei Typen von Tonhöhenwahrnehmung festgestellt. Musi- 
ker mit geschultem Ohr, die Musik analytisch auffassen, hören bevor- 
zugt mit dem rechten Ohr, prozessieren das musikalische Signal also in 
der linken Hirnhälfte. Sie nehmen die Tonhöhe als Frequenz des Grund- 
tons wahr. Der ungeschulte Musikliebhaber, der Musik als Gesamtphä- 
nomen genießt, wendet hingegen seine Aufmerksamkeit dem Körper 
des Tons zu und empfindet die Tonhöhe gesamthaft in ihrer spektralen 
Schattierung. 

Die Abweichung ist geradezu eine Regel ästhetischer Tonproduk- 
tion, die Störung des allzu Reinen ein Erfordernis. Der Sinuston ist kein 
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ästhetisches Ereignis, sondern eine spannungslose akustische Emission. 
Erst das Geräusch, erst die Schwankung schafft die Spannung, die aus 
dem bloßen physikalischen Reiz ein ästhetisches Ereignis macht. Win- 
ckel (1961: 63) stellt dieses Prinzip am Beispiel der Schallplattenproduk- 
tion der 1950er-Jahre dar, als die Kontrolltätigkeit ausgebildeter Ton- 
meister die Intonationsabweichungen gegen Null führte, weshalb das 
Publikum diese Aufnahmen als maschinell ablehnte. Das menschliche 
Element der Abweichung ist der Gegenpol einer durchstrukturierten, 
maximalen Ordnung. Ein Mindestmaß an Chaos, verbunden mit einem 
mittleren Maß an Ordnung, entspricht der menschlichen Wahrnehmung 
am besten, weil das Gehirn überhaupt nur Veränderungen verarbeitet, 
während stationäre Zustände zu Adaptationsprozessen und Langeweile 
führen. 

Der Aspekt einer exakt wahrnehmbaren Tonhöhe entscheidet — 
wie oben dargestellt - weit gehend, aber nicht ausschließlich über die 
Einteilung von Klangobjekten in die Kategorien Musik und Geräusch. 
Aber die Tonhöhe war über Jahrhunderte das entscheidende Element 
zur Organisation der westlichen Musik. Melodie und Harmonik sind 
Phänomene, welche sich direkt aus der Tonhöhenrelation sukzessiver 
oder synchroner Klänge entwickeln. Nur die wenigen Menschen mit 
dem absoluten Musikgehör sind in der Lage, Tonhöhen zu identifizie- 
ren («Ich höre ein eingestrichenes C.»). Im Vordergrund der Wahrneh- 
mung stehen vielmehr die Relationen zwischen den Tonhöhen benach- 
barter oder simultaner Klangobjekte. Diese Relationen zwischen den 
einzelnen Tönen - sie werden Intervalle genannt - sind für die Musikpro- 
duktion und -wahrnehmung entscheidend. Sie wirken sowohl simultan 
als harmonikale Beziehung zwischen gleichzeitig dargebotenen Klän- 
gen als auch konsekutiv zwischen nacheinander erklingenden Tönen 
als Melodie. Man empfindet sie entweder als konsonant oder als dis- 
sonant. 

Als Modell vereinfacht, geht es bei der Komposition von Klangmate- 
rial darum, solche Relationen zu schaffen. Ein einzelner, isolierter Klang, 
auch ein Geigenklang, ist keine Musik. Eine Melodie entsteht erst durch 
den Verbund von mehreren Tönen zu einfachen Gestalten, den Motiven, 
die - in vielfältiger Weise variiert — zu größeren Verbänden, den Themen, 
organisiert werden. 

Wie Schneider (1997: 52 f.) darstellt, der sich als Musikethnologe mit 
musikalischen Universalien in unterschiedlichen Kulturen befasst, sind 
die biologischen Gegebenheiten des auditiven Apparats direkt für einige 
fundamentale Organisationsprinzipien von Klangobjekten in Musik und 
Sprache zuständig. Dazu gehören in erster Linie das Oktavenphänomen, 
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die sensorische Konsonanz sowie das Transpositionsphänomen. Als Okta- 
venphänomen wird die Beobachtung bezeichnet, dass in den unterschied- 
lichsten Ethnien die Frequenzverdoppelung - also die Oktavierung - die 
wichtigste Basis für die Einteilung von Tonhöhen in Skalen (Tonleitern) 
bildet. Mit sensorischer Konsonanz ist die weitgehende interindividuelle 
Übereinstimmung darüber zu verstehen, dass Intervalle, die sich physi- 
kalisch-mathematisch als einfache Brüche darstellen lassen, konsonanter 
erscheinen als komplexe Frequenzverhältnisse. Weiter meint das «Trans- 
positionsphänomen, dass die absolute Tonhöhe von untergeordneter 
Bedeutung ist und Melodien auch dann als «identisch» aufgefasst werden, 
wenn sie auf verschiedenen Tonstufen, sogar in unterschiedlichen Lagen 
erklingen» (Schneider 1997: 52). Biologische Tatsachen sind in dieser 
Sichtweise der kulturellen Ausdifferenzierung selbst so komplexer abs- 
trakter Strukturen wie musikalische Kompositionen vorgeschaltet. Aller- 
dings muss bei diesen Überlegungen berücksichtigt werden, dass der 
auditive Apparat sich zuvor während geraumer Zeit evolutionär auf die 
Wahrnehmung überlebensnotwendiger akustischer Informationen aus 
den Segmenten Sprache und Geräusch hin optimiert und sich die Musik 
erst später aus dem intentionalen Spiel mit Geräuschen entwickelt hat 
(Maioli 1991). 


Klangfarbe 


Zur Beschreibung der Klangfarbe (Timbre) müssen Grundlagen vorgezo- 
gen werden, die ich im Kapitel Material (> 335) ausführlich behandeln 
werde. 

Einige Körperoder Resonatoren haben die Eigenschaft, dass sie — ein- 
mal in Schwingung versetzt - so genannt harmonische Teilschwingungen 
produzieren, die ganzzahlige Vielfache der Grundfrequenz sind. Diese 
Teilschwingungen oder Obertöne bilden die physikalische Grundlage der 
Klangfarbe. Ein solcher harmonischer Aufbau ist ein Charakteristikum 
der meisten musikalischen Klänge. Traditionelle Musikinstrumente — 
Streich-, Blas- und Tasteninstrumente — erzeugen solche harmonische 
Klänge. Bei einer Grundfrequenz von 110Hz (= A) sind die Obertöne ent- 
sprechend 220 Hz (= a), 330 Hz (= e!), 440 Hz (= a), 550 Hz (= cis?), 660 Hz 
(= e?) usw., in musikalischen Intervallen ausgedrückt: eine Oktave, eine 
Quinte, eine Quarte, eine große und eine kleine Terz. Eine Oktave ent- 
spricht immer einer Frequenzverdoppelung. Die Obertöne können vom 
geschulten Ohr bis zur 5. Harmonischen analytisch wahrgenommen 
werden. 
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Harmonische komplexe Töne entstehen bevorzugt durch physikalische Pro- 
zesse, in welchen ein schwingungsfähiges System durch anhaltende Energie- 
zufuhr zu stationären Schwingungen angeregt wird. Daher sind die Schalle 
der stimmhaften Sprachlaute, die Gesangsstimme, und die Tonsignale aller 
musikalischen Blas- und Streichinstrumente vom Typ des harmonischen 
komplexen Tones - jedenfalls, solange sie in konventioneller Weise erzeugt 
werden. (Terhardt 1998: 218) 


Wie Terhardt (1998: 87) außerdem belegt, sind es nicht allein mathemati- 
sche Grundlagen, welche die Harmonizität eines Klangs bestimmen, son- 
dern die Hörempfindung. Mathematisch gesehen wäre die Reihe 610, 810 
und 1010Hz das ganzzahlige Vielfache einer Grundfrequenz von 10 Hz, 
sie wird jedoch als nicht harmonisch empfunden. 

Jeder Instrumentalklang wird weiter charakterisiert durch zusätz- 
liche, nicht harmonische Anteile, welche besonders den Einschwingvor- 
gang kennzeichnen (ausführlich dargestellt in Handel 1989: 113ff., und 
Dickreiter 1987: 79 ff.). Umgekehrt können auch menschliche Stimmen und 
Tierstimmen — zum Beispiel das Miauen einer Katze - harmonische Klänge 
erzeugen. Platten - dazu zählen auch gekrümmte Platten wie Gongs, Glo- 
cken oder Gläser und quietschende Türen - erzeugen pseudo- oder gering- 
harmonische Klänge oder Klanggemische mit einem teilharmonischen 
Aufbau. Teilharmonisch sind ebenfalls Klänge, die durch das Anschlagen 
von «Stäben aus Metall, Holz oder Kunststoff, Metallröhren oder mem- 
branartigen Körpern entstehen. [...] Alle gering harmonischen Klangsig- 
nale haben gemeinsam, dass sie durch freie Schwingungen von Körpern 
entstehen, welche durch einen Schlag angeregt wurden. Die gering harmo- 
nischen komplexen Töne sind daher stets zugleich perkussionsartig» (Ter- 
hardt 1998: 219) Percussioninstrumente haben nur in geringem Umfang 
eine exakte Tonhöhe und keinen harmonischen Spektralaufbau. 

Winckel (1960: 135) stellt den Begriff Klang(farbe) im Zusammen- 
hang mit natürlichen Lauten überhaupt infrage, da natürliche Laute sich 
ständig ändern und selten über eine rein harmonische Obertonstruk- 
tur verfügen. Dieser berechtigte Einwand scheint mir für die folgenden 
Überlegungen dennoch zu puristisch und zu sehr an einer musikalischen 
Vorstellung von Klang orientiert. Statt harmonischer spektraler Zusam- 
mensetzungen — den klassischen Grundanforderungen an die Ausbil- 
dung einer Klangfarbe - finden sich bei natürlichen Geräuschen Bünde- 
lungen in einzelnen Frequenzbereichen, die ebenfalls die Empfindung 
von klanglicher Farbigkeit erzeugen können. 

Viele Klangobjekte sind nämlich nicht harmonisch aufgebaut, 
sondern setzen sich aus mehreren Schichten zusammen, die in keinem 


Klangfarbe 205 


ol Wi ooo 
a 


ecco 
Peak Frequency Band: 46875000 Fear Frequency Bang: 140.623000 Peak Frequency Sand: 93 /SCDICH 


16 Studioglocke, Telefon, Glocken (v.1.n.r.) 


direkten Verhältnis zueinanderstehen. Das Geräusch eines Kaminfeu- 
ers beispielsweise besteht aus dumpfem Flackern, einem mittigen Bro- 
deln und zwei hochfrequenten Anteilen: dem Zischen und dem Knis- 
tern. 

Die Klangfarbe wird überwiegend subjektiv empfunden. Nur 
geschulte Hörer sind imstande, die einzelnen Komponenten auseinander- 
zudividieren. Physikalisch lässt sie sich jedoch durch die Fourier- oder 
Spektralanalyse messen, welche die Teiltonbereiche auseinander sortiert 
und grafisch darstellt. Zur Illustration zeigt Abb. 16 drei Klangfarben, die 
aus THE PLAYER (USA 1992) von Altman stammen. 

Die Studioglocke, die gleich zu Beginn des Films zu hören ist und 
das technische Team ebenso wie die Schauspieler zu Ruhe und Konzen- 
tration auffordert, wirkt aufgrund ihrer spektralen Verteilung mit zwei 
deutlichen Spitzen um 4,5kHz sehr durchdringend und hell. Dieser Fre- 
quenzbereich deckt sich mit dem Bereich der größten auditiven Emp- 
findlichkeit (Abb. 15, > 200). Im Vergleich klingt das Telefon im Büro 
sehr moderat, geradezu angenehm warm (wie Telefonklingeln in Wirk- 
lichkeit nie ist, aber dieses Thema wird an anderer Stelle behandelt). Die 
Klangdifferenz ist nicht nur spürbar, sondern aus der grafischen Umset- 
zung auch klar ersichtlich: wenige Obertöne mit geringer Intensität, eine 
Spitze bei 2,5kHz. Die Glocken sind im Gegensatz zu den beiden vorher 
besprochenen Tönen nicht durch einen harmonischen Aufbau der Teil- 
töne bestimmt, sondern werden durch eine diffuse Massierung in einem 
Bereich von 2 bis 4kHz charakterisiert. Diese eigenartige Verteilung der 
Obertöne - sie wurde als pseudoharmonische Struktur bezeichnet - ist 
typisch für den Glockenton und trägt neben ihrem semantischen Gehalt 
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als kulturell reich befrachtetes Signal wesentlich zur ästhetischen Wir- 
kung bei. 

Eine systematische Typologie der Klangfarbe von Geräuschen zu ent- 
werfen, ist nicht einfach. Mit der Klassifikation von Geräuschen haben 
sich bisher vor allem die Vertreter der Musique concrete befasst, allen voran 
Pierre Schaeffer. In Traite des objets musicaux (1966) behandelt er sämtli- 
che Aspekte in so grundlegender und vielschichtiger Weise, dass alle mir 
bekannten Folgepublikationen auf seinen Ergebnissen aufbauen. Auch 
R. Murray Schafer (1977) arbeitet weitgehend mit dem von Schaeffer ent- 
wickelten Instrumentarium, das er an zahllosen Beispielen von litera- 
rischen Schilderungen und weltweiten eigenen Forschungen erläutert. 
Moles (1952: 224) schlägt im Anhang zu Schaeffers A la Recherche d’une 
musique concrete ein relativ rudimentäres Modell vor, das den Vorteil hat, 
infolge seiner Vereinfachung genügend transparent zu sein. Dieses Modell 
wird im Verbund mit Schafers Überlegungen zur Klangfarbe natürlicher 
Geräusche zum Ausgangspunkt der folgenden Beschäftigung mit typolo- 
gischen Aspekten der Klanglichkeit. Sämtliche Aspekte dieser Darstellung 
habe ich an der Eidgenössischen Materialprüfungs- und Forschungsan- 
stalt (EMPA) messtechnisch überprüft. 

Die farbigen grafischen Darstellungen (> 212ff.) sind das Resultat 
dieser Messungen, sogenannter Terz-Band-Analysen. Sie sind teilweise 
zweidimensional mit den Dimensionen Pegel in dB und Frequenz in Hertz 
(Hz) oder dreidimensional mit den Dimensionen Zeit in Sekunden, Frequenz 
in Hz und farbstufencodiert der Pegel in dB, wobei der Verlauf von Rot 
nach Blau einen abnehmenden Pegel darstellt. 

Die Klangfarbe ist nur in Grenzen allein von der Frequenzverteilung 
abhängig. Vielmehr ist bei allen akustischen Erscheinungen immer eine 
Interdependenz aller physikalischen Parameter - neben der Frequenz vor 
allem der Lautheit und der frequenzabhängigen Hüllkurve - zu beob- 
achten, sodass jede isolierte Betrachtung einzelner Aspekte zugleich eine 
modellhafte Vereinfachung darstellt. Diese Vereinfachung ist insofernlegi- 
tim, als dadurch die einzelnen Komponenten zu sinnlich überprüfbaren 
Qualitäten werden. 

Moles (1952: 224) unterteilt die Klangfarbe zunächst in drei Berei- 
che, die er Farbe (couleur), Reichhaltigkeit (richesse) und Dichte (épaisseur) 
nennt. Unter Dichte subsumiert er vier Typen: rein (pur), schmal (mince), 
breit (épais) und weiß (blanc). Die Farbbezeichnung «weiß» stammt aus 
dem optischen Bereich, wo die Summe aller Farben Weiß ergibt. 


e Weiß ist ein breitbandiges Rauschen, das sich über alle Frequenzberei- 
che erstreckt. Weiß kommt unter natürlichen Geräuschen nicht vor. 
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e Als rein wird ein Sinuston bezeichnet, wie er im Versuchslabor des Psy- 
choakustikers erzeugt wird (Abb. 17, — 212). 

e Schmal ist zum Beispiel das Zirpen der Grillen (Abb. 18, > 212). 

° Als breit lässt sich dagegen das Geräusch eines Staubsaugers bezeich- 
nen (Abb. 19, > 213). 


Farbe (couleur) unterteilt Moles in brillant, hell (clair) und dunkel (sombre). 
Diese Unterscheidung bewährt sich für traditionelle Musikinstrumente. 
Natürliche Klangobjekte mit ihrer komplexen, meist unharmonischen 
Struktur entsprechen selten diesem Schema. Insbesondere muss der Begriff 
Brillanz durch Schärfe ersetzt werden, die Terhardt folgendermaßen definiert: 


Die Schärfe eines Schallsignals wird im Wesentlichen durch dessen hoch- 
frequente Anteile des Fourierspektrums hervorgerufen, und sie nimmt mit 
wachsendem Schallpegel zu. [...] Wird die obere Grenzfrequenz eines Schall- 
signals, dessen Fourierspektrum den ganzen Hörbereich überdeckt, schritt- 
weise abgesenkt, so nimmt die Schärfe ab [...]. Wird umgekehrt die untere 
Grenzfrequenz schrittweise angehoben, so nimmt die Schärfe zu. 

(Terhardt 1998: 302) 


Weiter ist davon auszugehen, dass die Schärfe mit zunehmender Lautheit 
ebenfalls zunimmt, das heißt, alle Faktoren spielen auch hier exemplarisch 
zusammen. 

Reichhaltigkeit (richesse) definiert Moles weiter durch die Anzahl der 
Obertöne mit der Unterscheidung voller Klang (timbre riche) und dünner 
Klang (timbre pauvre). 


° Voll ist zum Beispiel der Klang der Glocke (Abb. 20, > 213). 
e Dünn ist dagegen das traditionelle Läuten des Telefons (Abb. 21, 
— 214). 


Zur Beschreibung zusammengesetzter Klangobjekte schlägt Schafer (1977: 
136f.) eine Kombination aus Frequenz und Masse vor. Mit Masse meint er 
Frequenzbündel in spezifischen Bereichen, wie sie beispielsweise bei den 
Glocken (Abb. 16, > 205) zu beobachten sind. Die Frequenzbiindel heben 
sich durch charakteristische Verteilungen des Pegels hervor, sodass für 
jedes Geräusch ein typisches Muster entsteht. Dieses Muster lässt sich mit 
dem dreidimensionalen Codierungsverfahren sehr schön darstellen. Mit 
Absicht habe ich allgemein vertraute Beispiele gewählt, die jeder in sei- 
nem auditiven Gedächtnis abgespeichert hat. Es lohnt sich, diese innere 
Vorstellung beim Betrachten der Grafiken zu aktivieren, sodass sich zwi- 
schen Bild und auditiver Empfindung ein Zusammenhang ergibt. 
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e Als erstes Beispiel wird ein unspezifisches dumpfes, bassiges Rumpeln 
analysiert, das ich in dieser Arbeit als UKO bezeichne. 

° Seine Masse liegt ausschließlich im Bereich von 31 bis 125 Hz. Einzel- 
nes deutlicher hörbares Grollen bildet in der Grafik dunkle Inseln mit 
maximalem Pegel (Abb. 22, — 214). 

° Im Gegensatz dazu sind beim Feuer die Frequenzbündel in verschiede- 
nen Bereichen angesiedelt, im vorliegenden Fall ein dumpfes Flackern 
in den Bässen und zusätzlich einzelnes Knistern in sehr hohen Berei- 
chen ab ca. 2.000Hz (Abb. 23, — 215). 

e Das Vogelgezwitscher besteht aus einzelnen Frequenzbündeln zwi- 
schen 1.250 und 5.000 Hz, die sich in deutlich umrissenen einzelnen 
Rufen manifestieren (Abb. 24, — 215). Aufschlussreich ist in diesem 
Beispiel auch der Rhythmus, der deshalb später nochmals genauer 
unter die Lupe genommen werden soll. 

° Regen ist im Vergleich dazu ein sehr unspezifisches Breitbandgeräusch, 
das tiber keine charakteristische Klangfarbe verfiigt. In diese Kategorie 
fallen außerdem das Stimmengewirr im Restaurant, Applaus oder ein 
Wasserfall (Abb. 25, — 216). 

° Ein komplexes Bild zeigt sich im Fall einer großen zerbrechenden 
Scheibe. Der Schlag zu Beginn deckt einen breiten Frequenzbereich ab, 
danach sind zunehmend nur noch die einzelnen fallenden Teile zu hö- 
ren, die sehr scharfe, hochfrequente Geräusche verursachen (Abb. 26, 
— 216). 


Bässe 


Seit der Einführung von Motoren und Maschinen hat sich das Frequenz- 
spektrum der Lautsphäre deutlich nach unten verlagert, wie Schafer 
(1977) beschreibt. In der Musikelektronik kann seit den 1960er-Jahren ein 
eigentlicher Bassfetischismus beobachtet werden, der sich mit der Ein- 
führung von Dolby-Stereo auch im Kino niederschlägt. In einem ebenso 
kurzen wie grauenvollen Intermezzo hatte das sogenannte Sensurround- 
Verfahren sogar durch eine extreme Verstärkung ganz tiefer Frequenzen 
die Eigenresonanz des Kinomobiliars aktiviert, um Katastrophen in taktile 
Reize zu überführen. 

Die Betonung der Bässe ist unter anderem deshalb so wirksam, weil 
sie sich von unserer Alltagswahrnehmung deutlich unterscheidet. Bässe — 
so sehen wir aus der Grafik isophonischer Hörkurven (Abb. 15, > 200) - wer- 
den vom menschlichen Ohr relativ schlecht verarbeitet. Die Verstärkung 
auf der Wiedergabeseite durch den Dolby-Prozessor, der im Spectral-Re- 
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cording-Verfahren eine Frequenzwiedergabe bis 20 Hz ermöglicht (Dol- 
by-Dokumentation), arbeitet dieser nattirlichen Limitierung des Ohrs ent- 
gegen. Wenn ich eine Kunstkopfaufnahme von THE PLAYER (USA 1992, 
Robert Altman) anhöre - und sei dies auf einem Waldspaziergang - so sind 
es die Bässe, die mich mental ins Kino katapultieren. Die exaltierte Bass- 
wiedergabe im Kino ist Teil jener Strategie, die Elsaesser (1998: 191) Uber- 
flutung (engulfment) nennt. Es ist die distanz- und perspektivlose Reiz- 
überflutung, bei welcher der Reiz als solcher zur Aussage mutiert. 


Überflutung soll eine besondere Form der Konsequenz, der Implikation und 
der wechselseitigen Beziehungen bezeichnen: gleichzeitig eine abgeschwäch- 
te Form der Kausalität, aber ebenso etwas Gefährlicheres, das nicht mehr in 
jener Distanz gehalten werden kann, die von einer Beteiligung über Auge 
und Kopf gewährleistet wird.? (Elsaesser 1998: 204). 


Der Körper des Zuschauers wird zum Fokus eines spektakulären Reiz-Re- 
aktions-Mechanismus, welcher die distanzierte Reflexion ausblendet. Die 
Feier des puren Reizes ist ein Erbe jener rebellischen Jugendkultur, die sich 
Ende der 1950er- und in den 1960er-Jahren unter den Emblemen von Sex, 
Drugs and Rock “n” Roll formiert hatte. 

Zwei psychologische Momente der Basswahrnehmung werden in 
dieser Strategie virulent: 

Bässe sind durch ihren diffusen Abstrahlmechanismus besonders 
geeignet, den von Adorno beschriebenen archaischen Effekt zu generieren. 
Sie umhüllen die gesamte Zuschauerschaft in einer verbindenden, gleich- 
schaltenden Weise. Es ist jener Bereich des Frequenzspektrums, in wel- 
chem der auditive in einen taktilen Reiz übergeht oder wo auditiver Reiz 
und taktiler Reiz einander überlappen und den Körper als Ganzes erfas- 
sen. Es ist dieser Effekt, wenn die Bässe in Brust und Bauch vibrieren. Die 
direkte Verbindung zum Körper ist es auch, welcher die Bässe in einen 
unmittelbaren Zusammenhang zur Sexualität bringt. Die Autoindustrie 
nutzt diesen Effekt, indem sie basslastige Motoren entwirft, welche Potenz 
ausdrücken (Hirschel/ Wilsdorf 1993: 47). 

Das zweite Moment psychologischer Wirkung gründet auf der Nach- 
barschaft des vestibulären Systems, also des Gleichgewichtsorgans, zum 
Innenohr (Abb. 13, > 194), das für die Bassrezeption bis 800 Hz empfind- 
lich ist und akustische Impulse in diesem Bereich in Bewegungsimpulse 
umsetzt. Die rhythmische Struktur, welcher Bässe unterworfen werden, 


2  «Engulfment thus is meant to indicate a distinct mode of consequence, of implication 
and interrelation, signifying at once an attenuated kind of causality, but also something 
more dangerous, because no longer capable of being kept at the sort of distance that 
engagement via the eye and mind assures.» 
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entscheidet dartiber, ob man sie als beruhigend oder aufregend empfindet. 
Eltern wissen heute, dass das gleichmäßige Brummendes Automotors das 
beste Mittel ist, überreizte Säuglinge zum Schlafen zu bringen, und dieser 
Effekt wird von der Tonspur immer dann eingesetzt, wenn eine ruhige 
Grundstimmung vorherrschen soll. Brummen, Surren, Summen sind solche 
gleichmäßigen, beruhigenden bis einschläfernden Geräusche, die frei von 
jeder Denotation eine ähnliche Wirkung erzielen. Sie wirken heilend, ent- 
spannend und tröstend. Auriol (1991) berichtet von geglückten Versuchen, 
Patienten durch tiefe Frequenzen in einen Zustand der Trance zu überfüh- 
ren, in dem sie für Schmerzen unempfindlich sind. 

Die kultische Verwendung von basslastigen Instrumenten wie Trom- 
meln oder auch der Kirchenorgel, die bassbetonende Akustik sakraler 
Bauten seit der Romanik sowie das bassige Brummen der Kirchenglo- 
cken bauen nicht nur auf der besonders suggestiven Wirkung dieses Fre- 
quenzbereichs auf, sondern haben ihn über Jahrhunderte gepflegt und 
perpetuiert. Das göttliche Prinzip, das hier wirksam wird, manifestierte 
sich immer schon in einer Reihe von Naturphänomenen wie Donner, Feu- 
ersbrünsten, Felsstürzen oder Erdbeben, Phänomene, welche die Menschen 
über Jahrhunderte als direkten kommunikativen Akt Gottes empfanden. 
Diesen Bereich zu domestizieren und für die Reproduktion verfügbar zu 
machen, hat daher eine tiefere Bedeutung. Das Bedrohliche, das auf den 
Tonspuren in stereotyper Manier durch donnernde Bässe symbolisiert 
wird, nährt sich aus dieser metaphysischen Dimension. Dröhnen, Grollen, 
Rumpeln, Brausen sind Geräusche, die — unabhängig von ihrer Beziehung 
zur Quelle - an diese Tradition anknüpfen. 

Es lässt sich eine große Zahl von Tonspuren zitieren, die großflächig 
den Bassbereich zur Erzeugung suggestiver Botschaften instrumentali- 
sieren. Immer sind es deutlich emotional gefärbte Szenen, in welchen die 
Bässe signifikant häufig mit Angst, Bedrohung und Anspannung korre- 
lieren. Diese Zuordnung ist so stabil, dass man sie problemlos als Stereo- 
typ klassifizieren kann. Sie hat ihre Wurzeln bereits im musikalischen 
Repertoire des Stummfilms. Schmidt (1982: 17) zitiert aus der Kinothek 
Giuseppe Becces, wo dunkel dräuende Szenen von klumpiger Harmonik 
in den tiefsten Lagen begleitet wurden. Wenn dunkle Streicher die deut- 
sche Nationalhymne intonieren wie in WıLson (USA 1944, Henry King, 
2.04.12-2.09.59), so generiert diese Intonation eine spezifische Interpreta- 
tion hinsichtlich der aufziehenden deutschen Gefahr. Dieses Stereotyp hat 
aus technischen Gründen zunächst vor allem in der Filmmusik überlebt. 
Wie im Abschnitt Frequenzwahrnehmung (> 201) dargestellt, werden bei 
harmonischen Tönen die Grundtöne vom menschlichen Ohr auch dannex- 
trapoliert, wenn sie unterhalb des Übertragungsbereichs liegen. 
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Harmonische Strukturen finden sich jedoch vor allem in musika- 
lischen Klängen. Bassige Geräusche fehlen im Korpus deshalb bis zum 
Auftreten des Magnettons in den 1950er-Jahren weitgehend. Neben dem 
Donner, der als bassiges Geräusch par excellence gilt (> Donner 356), sind 
vereinzelt basslastige Kriegsgeräusche zu hören oder auch die Jet-Sounds 
in David Leans Fliegerdrama THE SOUND BARRIER (GB 1952). Das unde- 
finierbare Grollen, das mit dem Donner verwandt, aber als UKO nicht 
lokalisierbar ist, tritt erstmals in LAWRENCE OF ARABIA (GB/USA 1962, 
ebenfalls von David Lean) als nur schwach diegetisch motivierter Hinweis 
auf bedrohliche Situationen auf. Wenn in STAR Wars (USA 1977, George 
Lucas) das Empire als Hort des Bösen gleich zu Beginn über eine dun- 
kel bassige Modulation charakterisiert wird, so ist auch der emotionale 
Aspekt dieses Klangobjekts so weit gefestigt, dass es für sich selbst spricht. 

Am deutlichsten tritt die ausgedehnte Verwendung von Bässen in 
drei Filmen zutage, welche mit einer äußerst präzisen und gleichzeitig 
stilisierten Tonästhetik operieren: THE BLACK STALLION (USA 1979, Car- 
roll Ballard), RAGING Burr (USA 1980, Martin Scorsese) und RUMBLE FISH 
(USA 1983, Francis Ford Coppola). 

Besonders modellhaft ist die Behandlung der Basse in Coppolas 
RUMBLE FisH (USA 1983), einem Film, der sehr bewusst und innovativ mit 
den Möglichkeiten der Tonspur operiert. Zwischen Musik und Geräusch 
entsteht eine faszinierende Interaktion. Die musikalische Komposition 
von Stewart Copeland, dem Schlagzeuger der Popgruppe The Police, und 
das zu weiten Teilen abstrakt-klangliche Sound Design von Richard Beggs 
sind in unüblichem Maß aufeinander abgestimmt. Der Kampf (0.11.36- 
0.17.36) zwischen zwei verfeindeten Gangs, der zu Beginn das Verhältnis 
zweier Brüder und ihr soziales Umfeld exponiert, findet in einer düsteren 
U-Bahn-Station statt. In dieser Szene überlagern sich verschiedene tief- 
frequente Geräusche. Die Grafik (Abb. 27, — 217) zeigt einen Ausschnitt 
daraus, in dem die einsetzende Percussion und ein dreifacher Donner 
einander überlagern. 

Zuerst erklingt mehrmals Donner, der bereits in der Szene davor 
eingeführt wurde und die drohende Gefahr ankündigt. Gleichzeitig ist 
ein andauerndes undefinierbares Rumpeln zu hören, das irgendwo in 
den verwinkelten Ecken erklingt. Ebenso zur Klasse der UKO gehört ein 
dumpfes rhythmisches Stampfen mit industriell-verhallter Klanglichkeit, 
das ab und zu auftaucht und wieder verschwindet, ohne dass diese Ver- 
änderungen durch einen Schauplatzwechsel motiviert wären. Während 
Züge vorbeifahren, füllen sie die Halle mit dumpfem Rattern, das von der 
Musik als perkussives Muster aufgenommen wird. Als weiteres Element 
kommt gegen Ende der Szene das tieffrequente Brummen eines Motorrads 
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dazu. Alle diese Elemente gruppieren sich immer wieder um eine Reihe 
von rhythmisierten Perkussionsmustern, die eine Bewegung andeuten, 
die im Dunkel der Halle stecken bleibt. Das dichte Geflecht verschiedener 
bassiger Laute erzeugt ein Gefühl des Ausgeliefertseins und repräsentiert 
eine allgegenwärtige, schicksalhafte Bedrohung. 

Auch in Filmen, die das Bassregister nicht in so auffälliger Weise 
als Träger suggestiver Botschaften ausschöpfen, gibt es Szenen, die einen 
deutlich expressiven Charakter aufgrund der signifikant abweichenden 
Betonung der Bässe entwickeln. Auf der Tonspur des PLAYER (USA 1992, 
Robert Altman) ist es zum einen eine Mordszene (0.33.12-0.37.34), zum 
andern eine Szene, in welcher die Hauptfigur in spektakulärer Weise einer 
Klapperschlange begegnet (1.06.26-1.08.00). Der Mord findet in einem 
Parkhaus statt, einem Setting also, das mit der U-Bahn-Station von RUM- 
BLE FisH verwandt ist. Dieser Raumtypus scheint eine solche akustische 
Atmosphäre mit wenig distinkten Klangobjekten im Bassregister zu recht- 
fertigen, die gleichzeitig die emotionale Verfassung der Figuren wider- 
spiegelt. Die mythische Qualität der Bässe, wie ich sie oben beschrieben 
habe, nimmt im Zusammenhang mit dem Mord eine bedeutsame Stellung 
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ein und wird durch das gleichzeitige Erklingen extradiegetischer Glocken 
besonders herausgearbeitet. Auch die Klapperschlangenszene schildert 
eine Grenzerfahrung zwischen Leben und Tod, die sich in der Bassbeto- 
nung niederschlägt. 

In CLOSE ENCOUNTERS OF THE THIRD KIND von Steven Spielberg (USA 
1977) begleiten brodelnde und donnernde Geräusche die bedrohliche 
Annäherung der Außerirdischen und lösen ein Klima hysterischer Aufge- 
regtheit aus. Die Konnotation Feuer, welche die flammenden Lichtkugeln 
der UFOs nahe legen, schlägt die Brücke vom Brodeln zum Endzeitgefühl, 
welches allerdings durch zahlreiche witzige Geräusche von ratterndem 
Spielzeug und brausenden Haushaltsmaschinen in typisch spielbergscher 
Manier ironisiert wird. 


Höhen 


Der zweite Bereich, der im Mainstreamfilm mit einer besonderen Aussage 
verbunden ist, befindet sich am anderen Ende der Skala: die Höhen. 
Hohe Frequenzen schaffen dank ihres stärker gerichteten Abstrahl- 
und Ausbreitungsverhaltens Transparenz und wirken gleichzeitig distan- 
zierend. Signalfunktionen von Geräuschen sind immer an hohe Frequenzen 
gebunden. Klingeln und Sirenen heben sich durch ihre durchdringenden, 
schrillen Klänge aus dem Wellensalat hervor. Und da ist auch an die Vogel- 
schreie in Hitchcocks THE Birps (1963) und die hohen Streicher-Tremoli 
in Bernard Herrmanns Komposition zu PsycHo (1960) zu denken, wo die 
schrillen Klänge deshalb so beunruhigend sind, weil sie die Assoziation 
zum menschlichen Schrei — genauer zum weiblichen Schrei — wachrufen. 
Hohe Frequenzen lösen entweder unangenehme Gefühle aus, wirken 
dünner, brüchiger, kälter oder auch strahlender, jubelnder. Diese Unter- 
schiede treten in Funktion der spektralen Zusammensetzung auf. Ein 
harmonischer Klang, wie eine schöne Sopranstimme oder eine Trompete, 
hat einen klaren, strahlenden Effekt. In nicht harmonischen Klangobjek- 
ten wirken sich massive Frequenzbündel in den Höhen als Schärfe aus 
(> 207). Die meisten Menschen überzieht sofort eine Gänsehaut, wenn sie 
an das schrille Sirren des Zahnarztbohrers, den durchdringenden Klang 
einer Kreissäge oder das kreischende Geräusch von Zugsbremsen denken. 
Manche Physiologen gehen davon aus, dass die hohen Frequenzen über 
die Knochen zur Cochlea geleitet werden. Diese Beobachtung erklärt den 
markerschütternden Effekt dieses Spektrums teilweise. Der Hauptgrund 
für die durchdringende Wirkung höherer Frequenzen geht aus der Gra- 
fik isophonischer Hörkurven (Abb. 15, > 200) hervor, aus der ersichtlich ist, 
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dass das menschliche Ohr zwischen 1 und 5kHz am empfindlichsten ist, 
in jenem Bereich, in dem alle diese Geräusche wirksam sind. Auriol (1991) 
weist darauf hin, dass verschiedene nervöse Störungen und Hautaffektio- 
nen auf die Belastung durch hohe Frequenzen zurückgeführt werden kön- 
nen. Der enervierende, beunruhigende, Angst auslösende Aspekt schril- 
ler Dissonanzen gehört zum unverzichtbaren Repertoire der Tonästhetik, 
bedeutet Gefahr oder löst Spannung aus. 

Tierschreie, Jets, Signallaute, Grillen, Vögel, Türenquietschen und 
metallische Geräusche sind jene Komplexe von Geräuschen, welche auf 
den Tonspuren des Mainstreamfilms in den hohen Bereichen angesiedelt 
sind. Es wird bei dieser Aufzählung sofort klar, dass diese Klangobjekte 
in Abhängigkeit von der semantischen Dimension sehr unterschiedliche 
Emotionen auslösen. Vögel und Grillen sind in der Mehrzahl mit ange- 
nehmen Assoziationen verbunden. Anders verhält es sich bei den Tier- 
schreien — zu denken ist an das schrille Quieken eines Ferkels als Stimme 
von E. T. oder an die durchdringenden Saurierschreie in JURASSIC PARK -, 
den Jets, einigen Signallauten und metallischen Geräuschen, die beson- 
ders dann an die Substanz gehen, wenn sie eine klangliche Verwandt- 
schaft mit dem menschlichen Schrei aufweisen. Sound Designer bedienen 
sich dieser Klangverwandtschaft, indem sie solche Klangobjekte entweder 
durch Schreie substituieren oder Schreie hinzufügen. 

Die distanzierende, Aufmerksamkeit heischende Qualität macht 
hohe Klangobjekte für die Strategie des emotionalen Appells über die 
reine Reizqualität weniger geeignet als die Bässe. In den zahlreichen Sze- 
nen, die ich messtechnisch analysiert habe, findet sich kein einziges Bei- 
spiel einer ausschließlichen Verlagerung des Frequenzspektrums in den 
Bereich der Höhen. Vielmehr zeigt sich im Korpus ab Mitte der 1970er- 
Jahre deutlich die Tendenz eines komplementären Auseinanderdriftens in 
beide extremen Frequenzbereiche gleichzeitig, wann immer sich die Situ- 
ation zuspitzt. Es kommt außerdem in der Mehrzahl aller Fälle noch eine 
ausgeprägte, kontrastreiche Dynamik hinzu, welche die Mehrdimensiona- 
lität dieser Gestaltungsstrategie unterstützt. 


7 Dynamik 


Wahrnehmung der Lautstarke 


Die akustische Dimension, für welche man im alltäglichen Sprachgebrauch 
den Begriff Lautstärke verwendet, wird als Schalldruckpegel bezeichnet. Da 
bereits ein mittlerer Schalldruck die leisesten noch wahrnehmbaren Töne 
um ein Tausendfaches übersteigt, wird der Schalldruckpegel als logarith- 
misches Maß in Dezibel angegeben. Dezibel (dB) sind relative Werte und 
bezeichnen Verhältnisse eines Schalldrucks p zu einer vorgegebenen Refe- 
renz p, von 2*10~Pa (Pascal), als Formel ausgedrückt: Schalldruckpegel 
L, = 10*log (p/p). Eine Verdoppelung des Schalldrucks entspricht einem 
Zuwachs von lediglich 6dB, eine Verzehnfachung einem Zuwachs von 
20 dB; 120 dB entsprechen einer Zunahme um den Faktor 1 Million. Da 
das Ohr in verschiedenen Frequenzbereichen unterschiedlich empfindlich 
ist (> isophonische Hörkurven 200), wird die Lautstärkeempfindung häufig 
gewichtet in Abhängigkeit von der Frequenz dargestellt. Dafür haben sich 
die Bezeichnungen dB (A), dB (B) und dB (C) etabliert, welche aufgrund 
von spezifischen Filterkurven die Empfindungen des Ohrs nachbilden. 

Zwischen Lautstärke und Tonhöhe besteht eine weitere Beziehung. 
Psychoakustiker haben schon im 19. Jahrhundert bemerkt, dass sich die 
Empfindung der Tonhöhe eines reinen Sinustons in Abhängigkeit von 
der Intensität, mit welcher er dargeboten wird, verändert, und zwar mit 
folgenden Gesetzmäßigkeiten: Eine Zunahme der Intensität bewirkt bei 
hohen Tönen eine Erhöhung, verändert wenig in mittleren Tonlagen und 
lässt tiefe Töne noch tiefer erscheinen (Buser /Imbert 1987: 40). 

Die kleinen Muskeln im Mittelohr schützen die Cochlea vor einer 
Reizüberlastung bei Pegeln zwischen 80 und 110dB (> 194). Innerhalb 
von 50 ms kontrahieren die Muskeln von Hammer und Amboss simultan 
und bewirken eine Begrenzung des Reizes. Derselbe Reflex passt die Hör- 
empfindung unserer eigenen Stimme an die Lautstärke der Umgebung an, 
wenn wir sprechen (Pickles 1982: 275; Bailblé 1979: [4] 17 £.). 

Wird das Ohr über längere Zeit einem stabilen Reiz ausgesetzt, so 
adaptiert es sich. Diese Gewöhnung hat zur Folge, dass ein gleichbleiben- 
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der Dauerton immer leiser erscheint und das Gehör ermüdet. Urteile wie 
laut und leise werden deshalb immer in Relation zum momentanen Durch- 
schnitts- oder Adaptationsniveau gefällt (Schick 1979: 87). Als weiterer 
Faktor bei der subjektiven Beurteilung von Lautheit spielen die Bewertung 
der Schallquelle sowie spezifische Klangeigenschaften eine Rolle, insbe- 
sondere Rauigkeit (> 228) und Schärfe (> 207). Guski (1987: 109 f.) stellt 
nach Durchsicht verschiedener Untersuchungen zur subjektiven Empfin- 
dung der Lautheit fest, dass die Faktoren Gefährlichkeit, Gesundheitsschäd- 
lichkeit und Vermeidbarkeit entscheidender für das Urteil sind als der mess- 
bare Mittelungspegel. Verschiedentlich — zum Beispiel in Schick (1979) 
oder Guski (1987) — werden psychische Dispositionen für die individuelle 
Beurteilung der Lautstärke in Betracht gezogen. Müdigkeit, Ärger und 
Stress sind weitere Faktoren, welche die Lärmempfindlichkeit begünsti- 
gen. 

Im Kino wird ein mittlerer Dialog am Zuhörerplatz mit circa 65dB 
wiedergegeben. Den maximalen Schalldruck analoger Tonspuren bei 
einer standardisierten Wiedergabeeinstellung legt Holman (1997: 27) 
bei 90-95 dB fest, für digitale Tonspuren dagegen bei 110 bis 118dB. Der 
Schalldruck des Digitaltons beträgt somit im Maximum das 10-fache (!) 
eines analogen Tons. Liegt die Schmerzgrenze des menschlichen Ohrs 
durchschnittlich bei 120 bis 130 dB, so ist damit das Maximum erreicht. 
Als mittleren Schalldruckpegel gibt Holman (1997: 209) beispielsweise für 
Forrest Gump (USA 1994, Robert Zemeckis) 80dB an. 

In zwei Messungen, die Kurt Heutschi, wissenschaftlicher Beamter 
für Akustik bei der EMPA, in Kinos in der Schweiz durchgeführt hat, lag 
der Pegel deutlich unter diesen Werten. Alle Pegel verstehen sich als A-be- 
wertete, mit der Zeitkonstanten fast (125 ms) erfasste Schalldruckpegel. 
Die Zeitkonstante ist bedeutend für die Maximalpegel. 


Wp Witp West (USA 1999, Barry Sonnenfeld) gemessen am 
13.8.1999 im Zürcher Kino Cinemax 1, Reihe 14: 

Hintergrundmusik vor Beginn und in Pause: 50 dB (A) Werbung: 
70-80 dB (A) 

Trailer zu STAR Wars EPIsoDE I max. 86dB (A) 

Hauptfilm max. 89dB (A), typ. Dialog: 68dB (A), min. 37dB (A) 


STAR Wars EPISoDE I (USA 1999, George Lucas) gemessen am 
28.8.1999 im Zürcher Kino Corso 2, Reihe 9: 

Hintergrundmusik vor Beginn: 53 dB (A) 

Vom Publikum erzeugte Gesprächskulisse: 65dB (A) Werbung: typ. 
75dB (A) 
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THX-Spot: max. 85dB (A) 
Hauptfilm: max. 90 dB (A), typ. Dialog: 65 dB (A), min. 40 dB (A) 


Bei beiden Messungen war der subjektive Eindruck gigantischer als die 
Messresultate. Diesen Kontrast führt Heutschi auf ein grundsätzliches 
Problem der A-Bewertung zurück, die speziell bei hohen Pegeln den exal- 
tierten Bässen nicht gerecht wird.' 


Hüllkurve 


Die Hüllkurve ist ein wichtiger Parameter zur Analyse und Wahrneh- 
mung von Klangobjekten. Unter Hüllkurve (envelope) versteht man die 
Verteilung der Energie entlang der Zeitachse, oder anders ausgedrückt: 
die Dynamik eines Tons, die sich aus Einschwingvorgang (attack), Kör- 
per (sustain) und Ausklingvorgang (decay) zusammensetzt. Die engli- 
schen Bezeichnungen sind auch im deutschen Sprachraum sehr verbreitet 
(Abb. 28). 

Mit Einschwingvorgang wird der Zeitabschnitt bezeichnet, in dem sich 
der Klang aus der Ruhe bis zu seinem endgültigen Zustand entwickelt; 
Körper ist der quasistationäre Teil, in dem sich der Klang nur innerhalb von 
engen Grenzen verändert; Ausklingvorgang ist der letzte Zeitabschnitt nach 
dem Ende der maximalen Intensität bis zur völligen Ruhe. 

Die Hüllkurve ist das entscheidende Merkmal zur Identifikation 
von Klangobjekten (Handel 1989: 243). Jedes Klangobjekt — das natürliche 


1 Ioan Allen (1997) - der Vizepräsident von Dolby - hat in einem Paper darauf hingewie- 
sen, dass Kinobetreiber wegen Publikumsbeschwerden den Wiedergabepegel im Kino 
häufig nach unten korrigieren. Er befasst sich dort weiter mit dem umfangreichen Pro- 
blem der messtechnischen Bewältigung der subjektiven Lautstärkeempfindung, die 
nicht nur vom Pegel, sondern auch von der Dauer der Exposition abhängt. 
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Geräusch ebenso wie der musikalische Klang - entwickelt sich nach seinen 
eigenen Gesetzmäßigkeiten in Abhängigkeit von der Zeit. Die Hüllkurve 
kann so auch als die dynamische Kontur eines akustischen Ereignisses 
verstanden werden. Sie bezeichnet im Allgemeinen einen Mittelwert über 
alle Frequenzanteile gemessen. In komplexen Klängen verfügt jedoch 
jeder Frequenzanteil oder Oberton über eine eigene spezifische Hüllkurve. 
Diese Tatsache geht aus den folgenden Hüllkurven eines Schusses hervor; 
die eine Hüllkurve entspricht 80Hz, die andere 1.250 Hz. Typisch für Film- 
schüsse ist die doppelte Spitze in den Bässen (Abb. 29 und Abb. 30, > 217). 

Die Dauer eines Tons steht in direkter Beziehung zur Hüllkurve. Kurze 
Töne bestehen meist nur aus einem Einschwing- und einem Ausklingvor- 
gang. Lange Klangobjekte — zum Beispiel ein Helikoptervorbeiflug — sind 
gekennzeichnet durch einen ausgeprägten Körper, während bei Dauertö- 
nen — Flussrauschen oder Grillenzirpen - überhaupt nur ein quasistationä- 
rer Körper beschrieben werden kann, der natürlich auf einer Mikroebene 
ebenfalls Schwankungen aufweist, die jedoch in einen größeren Kontext ein- 
gebettet sind und sich daher eher als interner Rhythmus bemerkbarmachen. 

Entfernt man Teile der Hüllkurve, erhält man unbekannte, fremd- 
artige Klangobjekte. Die Identifikation von Klangobjekten wird vor allem 
dann erschwert, wenn der Einschwingvorgang weggeschnitten wird (Ter- 
hardt 1998: 384 f.). Solche Eingriffe waren die ersten Schritte zur abstrakten 
oder virtuellen Klangproduktion (> Verfremdung 285). 

Die meisten Autoren unterscheiden drei bis fünf verschiedene Typen- 
des Einschwing- und Ausklingvorgangs. In gut demokratischer Schweizer 
Manier will ich hier vier Typen aufführen, welchen auch vier Typen des 
Ausklingvorgangs entsprechen. 


e Autotüre (steil, Abb. 31) 

e Staubsauger (mittel, Abb. 32) 

° vorbeifahrender Zug (langsam, Abb. 33) 
e Glocke (zusammengesetzt) (Abb. 34). 


Der Körper kann entweder als fehlend, stabil oder moduliert beschrieben 
werden, wobei zwei Formen der Modulation zu unterscheiden sind. 
Die sogenannte Amplitudenmodulation bezeichnet Schwankungen in 
der Dynamik und steht in einem direkten Verhältnis zur Rauigkeit. Als 
Rauigkeit wird die schnarrende Hörqualität bezeichnet, welche sich aus rela- 
tiv raschen Fluktuationen ergibt (Terhardt 1998: 283). Je höher die Modula- 
tionsfrequenz — Terhardt (1998: 292) gibt eine untere Grenzfrequenz von 
30Hz an -, desto rauer erscheint der Ton. Die Frequenzmodulation ent- 
spricht dem Vibrato der Streichinstrumente und bezeichnet periodische 
Schwankungen der Tonhöhe. 
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e Schlag, Schritte auf Stein (fehlend, Abb. 35) 

e Flussrauschen (stabil, Abb. 36) 

° Geigenton mit Vibrato (moduliert, Abb. 37) 

e klassische Telefonklingel (pulsierend, Abb. 38) 
e das Knistern des Feuers (körnig, Abb. 39) 


Die verschiedenen Abschnitte (Einschwingvorgang, Körper und Aus- 
klingvorgang) können beliebig miteinander kombiniert werden und defi- 
nieren unterschiedliche Eindrücke. 

Manche Lautobjekte lassen sich nur in der periodischen Verteilung 
überhaupt verstehen. Als nächstliegende Beispiele könnten das Tickender 
Uhr, der Herzschlag und das Grillengezirpe dienen, die völlig unidentifi- 
zierbar sind, wenn nur ein einzelner Ausschnitt — ein Herzschlag oder ein 
Uhrenticken — dargeboten wird. Andere Geräusche bestehen nur teilweise 
aus rhythmisierten Elementen, zum Beispiel die vorbeifahrende Eisenbahn 
mit ihrem dumpfen Schlagen. Glocken können als Glockenschläge einfach 
erklingen oder als Glockengeläute eine rhythmische Textur entwickeln. 

Uhrenticken und Herzschlag lassen sich als einfache Muster beschrei- 
ben: Sie bestehen aus einem oder zwei verschiedenen perkussiven Tönen, 
die entweder paarweise oder in gleichmäßiger Periodizität auftreten. 
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Das dumpfe Schlagen des Zuges, das unten noch genauer dargestellt 
wird, zeichnet sich durch eine variationsreiche Verteilung von Momenten 
der beschleunigenden Verdichtung wie auch von größeren Pausen aus, 
genauso wie das Glockengeläute, das jedoch in seiner Struktur wieder 
geordneter erscheint. Völlig zufällig wird die Verteilung allerdings im Fall 
von Möwengeschrei und anderen Vogelstimmen. 

Das Metrum, wie es in der Musik gebräuchlich ist, schreibt ein exak- 
tes Zeitmaß vor und kann deshalb für die Aufgabe, natürliche Rhythmen 
typologisch zu erfassen, keinen Rahmen bilden. Schaeffer hält sich nur 
kurz und wenig verbindlich beim Thema Rhythmus auf. Interessanter- 
weise schlagen sowohl Winckel (1960: 76) als auch Schafer (1977: 226) als 
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Bezugssystem den Atem vor mit einem Zyklus von drei bis fiinf Sekun- 
den. Der Atem entspricht am ehesten einer subjektiv empfundenen Zeit- 
einteilung. Von diesem Bezugsaspekt aus könnten die Tempi verschiede- 
ner natiirlicher Rhythmen bewertet werden. Dem Parameter des Tempos 
müsste ein Parameter zugeordnet werden, der die Gleichmäßigkeit oder 
Ungleichmäßigkeit der einzelnen Perioden berücksichtigt, von gleichför- 
mig über periodisch gehäuft bis zufällig. Der Aspekt der Regularität ist von 
semantischer Tragweite. Absolut regelmäßig sind ausschließlich mecha- 
nisch erzeugte Klangobjekte, prototypisch das Uhrenticken oder die perio- 
dischen Alarm-Beeps in der Science-Fiction-Welt. 

In der musikalischen Rhythmik sind weiter die Versmaße gebräuch- 
lich, um das Verhältnis zwischen betonten und unbetonten Einheiten zu 
beschreiben, zum Beispiel als Jambus, etwas verächtlich auch als jambi- 
scher Trott bezeichnet, unbetont - betont (X0), Trochäus als betont — unbe- 
tont (0X) oder Anapäst (00X). (Umfassende Darstellung im Standardwerk 
von Grabner 1923: 32 ff.) 

Mehr als Grundzüge rhythmischer Muster lassen sich bei natürlichen 
Geräuschen im Gegensatz zur Musik nicht ausmachen. Einige von ihnen 
werden im Folgenden an konkreten Beispielen illustriert. 


° Die Vogelrufe (Abb. 40, — 218) zeigen im Bereich von 2.000 bis 3.150 Hz 
ein komplexes rhythmisches Muster mit der Akzentverteilung 00X 
00XX OX. 

° Wellen (Abb. 41, — 218) sind gleichförmig-beruhigend, aber nicht völ- 
lig regelmäßig. 

e Das Feuer (Abb. 42, > 219) gehört zum Typus amorpher Rhythmus, 
der in der Mehrzahl aller natürlichen Geräusche vorkommt. 

° Sirenen (Abb. 43, > 219) gehören zum Typus der völlig regelmäßigen 
Klangobjekte, wie sie nur von mechanischen oder elektronischen Quel- 
len erzeugt werden. 

e Das Rattern von Eisenbahnwagen (Abb. 44, — 218) zeigt ebenfalls ein 
eher regelmäßiges Muster von Doppelschlagen (0X0X 0X) mit leichten 
zeitlichen Abweichungen. 


Stille 


Kafka hat den Begriff der dröhnenden Stille geschaffen. «Für Kafka ist das 
Schweigen eine noch schrecklichere Waffe als der Gesang» (Berendt 1985: 
33). Schafer (1977) stellt in seiner umfangreichen Recherche literarischer 
Behandlung der Stille fest, dass die Literaten des 20. Jahrhunderts die 
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Stille vorwiegend negativ beschreiben: als bedrückend, todesähnlich, dumpf, 
unheimlich, furchtbar, düster, brütend, ewig, schmerzlich, einsam, schwer, ver- 
zweifelt, starr, spannungsvoll, brennend, alarmierend. Bailblé (1978: [1] 54) 
stößt ins gleiche Horn: «leere, psychotische Stille, Todesstille, Verlassen- 
heit, Besinnung».? Es ist jene Erfahrung der Stille, wie sie den Aufent- 
halt im schalltoten Raum charakterisiert, wo man so sehr auf sich selbst 
zurückgeworfen wird, dass man die eigenen Körpergeräusche als bedroh- 
lich laut empfindet. 

John Cage, der viel zitierte Guru der Stille als musikalischem Aus- 
drucksmittel, hat sich vom paradoxen Erleben der Nichtstille im schall- 
toten Raum der Harvarduniversität, wo er den hoch singenden Ton sei- 
nes Nervensystems und den tief pulsierenden Klang des Blutes in seinen 
Adern erlebt haben soll, zu seiner Komposition «4’33”» (1952) inspirieren 
lassen (Toop 1995: 140). «4’33”», auch häufig Silence genannt, ist die ostenta- 
tive Interpretation der Nichtstille. Ein Pianist öffnet den Tastendeckel und 
verharrt während genau 4 Minuten und 33 Sekunden in Reglosigkeit auf 
dem Podium und konfrontiert das Publikum mit den natürlichen Geräu- 
schen des Konzertsaals, mit sich selbst und den normierten Erwartungen 
des traditionellen Konzertbetriebs. Von den einen belächelt, von den ande- 
ren verehrt, demonstriert «4’33”» zumindest das Hauptcharakteristikum 
der Stille: Mangel und Abwesenheit. Es ist die betonte Präsentation einer 
Umkehr von Figur und Grund, wobei als Figur das intentional hergestellte 
Klangobjekt, als Grund die zufälligen und nicht intentionalen Elemente 
der leise im Hintergrund schwingenden Lautsphäre verstanden sind. Das 
Spiel mit Intention/Nichtintention, das - beeinflusst von Cages lebenslan- 
ger Beschäftigung mit den Lehren des Zen-Buddhismus — zum philoso- 
phischen Zentrum der am Zufall orientierten Kompositionstechnik wird, 
bezieht seine besondere Bedeutung aus dem Rahmen des Kunstbetriebs, in 
dem es stattfindet. Die nicht intentionale leise Lautsphäre hat nachts, nach- 
dem das Publikum den Saal verlassen hat und bevor die Putzkolonne ihn 
mit ihren eigenen Geräuschen füllt, eine völlig andere Bedeutung. Die Aus- 
sage von 4'33” wird deshalb ins Absurde transformiert im widersinnigen 
Unterfangen, die Komposition als Tonaufnahme auf den Markt zu bringen. 

Mehr noch als die Lautstärke ist die Stille eine Relation, die vom Kon- 
trast lebt. Und diese Relation ist im Kino nochmals eine andere als in Cages 
Komposition oder im leeren Konzertsaal. Die Stille selbst ist Gegenstand 
des Plans, sie wird sorgfältig komponiert in Relation zu einer übergeord- 
neten Struktur, dieman Dynamik nennt, und planvoll ausgefüllt mit leisen 


2 «Silence vide du psychotique, silence de la mort, de l’abandonnique, silence où se 
recueille la présence.» 
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Klangobjekten oder im äußersten Fall mit dem Bandrauschen. Anders als 
in Cages Komposition gehört der Rahmen der Stille auf der Tonspur zur 
selben materiellen Einheit wie sie selbst. Die Stille wird deshalb nicht vom 
Bewusstsein abgewiesen, sie wird weder belächelt noch verehrt, sondern 
in die Rezeption integriert. 

Das Paradox, dass Stille im Kino nicht die Abwesenheit von Ton sei, 
sondern viel mehr erst durch seine Anwesenheit möglich werde, hat die 
Filmtheorie seit den frühesten Tagen des Tonfilms beschäftigt. «Stille hat 
nur dort Bedeutung, wo es auch laut sein könnte. Wo eine Absicht dabei 
ist.[...] Dann wird sie zur großen dramatischen Begebenheit. Dann ist sie 
ein nach innen gekehrter Schrei, ein gellendes Schweigen» (Baläzs 1930: 
159). Diese Tatsache wird besonders evident, wenn man bedenkt, dass der 
messbare Pegel an den leisesten Stellen im Kino immer noch mindestens 
40 dB beträgt (> 226). 

Stille ist eine eigene Kategorie der Klanggestaltung. Sie gehört weder 
zu den Geräuschen noch zur Musik oder zur Sprache. Wenn die Geräu- 
sche als Ausdruck einer subjektiven Bewusstseinstransformation ver- 
schwinden (> 397), ist diese Strategie nicht a priori mit Stille identisch. 
In vielen Fällen übernimmt die Musik die akustische Kommunikation mit 
dem Zuschauer, besonders wenn emotionale Zustände wie Trauer oder 
Freude indiziert werden. Stille selbst transportiert auf der Tonspur selten 
eine friedvolle - traurige oder glückliche - Grundstimmung. 

Die bedrohliche Dimension der Stille resultiert aus der potenziellen 
Gefahr der Totenstille: Nur was tot ist, ist still. Die Stille ist nicht nur ein 
Tabu der Tonspur, wie manche Kritiker meinen, weil man sie sogar mit 
dem Rauschen des Magnetbands auffüllt, sondern sie ist ein gesellschaft- 
liches Tabu, dem Akustikdesigner entgegenarbeiten, wo immer es geht. 


«Normalität» wird als kontinuierlicher Fluss aufgebaut, und die Abwesen- 
heit von Ton ist, in der Sprache der Techniker, ihr Tod. Wenn die Tonspur 
auf einem Schnitt «erstirbt», dann ist der Übergang sozusagen theologisch: 
«Tod» und «Leben» sind Assoziationen, die kontinuierlich mit dem Ton ver- 
bunden werden.’ (Doane 1980b: 57) 


Fast immer sind in den Filmen nach 1933 sehr leise Geräusche zu hören, 
welche die Stille unterstreichen: das leise Knarren eines Sessels, das Ticken 
einer Uhr, ein leiser Windhauch. Stille als totale Abwesenheit von Ton wird 
mehrheitlich vermieden. 


3 «Normality» is established as a continuous flow, and the absence of sound, in the lan- 
guage of the sound technicians, is its death. When the sound track goes «dead on the 
cut», the transgression is one of a theological nature. «Death> and «life» are consistently 
metaphors associated with sound.» 
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Fallstudien: Stille 


a) Stille als Todessymbol 


Stille wird denn auch auf filmischen Tonspuren weitaus am häufigsten mit 
Todesszenen assoziiert, unter anderem in: 


e THE Exorcist (USA 1973, William Friedkin, 1.33.30-1.54.54): Der Exor- 
zismus wird vorgenommen, Carras übernimmt den Teufel und stürzt 
sich aus dem Fenster. 

° THE DEER HUNTER (USA 1978, Michael Cimino): Hirschjagd (0.49.48- 
1.05.34): Bei tödlichem Schuss auf den Hirsch bricht die Musik plötzlich 
ab; nach der Heimfahrt spielt einer der Männer ein lyrisches Chopin- 
Stück, die Männer werden still, und in der Stille taucht langsam das 
Geräusch eines Hubschraubers auf; (2.27.34-2.43.30): Nick erkennt 
Michael nicht mehr, vor den Augen von Michael erschießt er sich. 

° APOCALYPSE Now (USA 1979, Francis Ford Coppola): Bootsfahrt 
(1.04.36-1.17.19): Die Besatzung begegnet einem vietnamesischen Boot, 
das sie sinnlos überprüft und dann in einem Anfall überreizter Nervo- 
sität die Bauernfamilie tötet; (1.26.43-1.37.45): Zwei Besatzungsmitglie- 
der werden von unsichtbaren Gegnern getötet. 

° E.T. — THE EXTRATERRESTRIAL (USA 1982, Steven Spielberg, 1.21.29- 
1.45.49): Tod und Wiederauferstehung von E. T.. 

° Our oF AFRICA (USA 1985, Sydney Pollack, 2.18.43—2.26.12): Finch Hat- 
ton stirbt. 

e Bırp (USA 1987, Clint Eastwood, 1.46.31-2.09.04): Krankheit und Tod 
von Charlies Tochter mit Markierung der Stille über Knistern der bren- 
nenden Zigarette und Speichel im Mund klebrig. 

e Dancers WITH Wo ves (USA 1990, Kevin Costner, 2.27.45-2.35.29): Die 
Soldaten werden beim Uberqueren einer Furt von den Sioux getötet, in 
einem Schlussbild schwimmt das Tagebuch davon. 


Fritz Lang hatte die Todesassoziation von Stille schon 1931 in M - EINE 
STADT SUCHT EINEN MÖRDER (Deutschland 1931, 0.04.52-0.06.58) verwen- 
det, einer Montage von verschiedenen leeren Schauplätzen, an denen die 
Mutter des ermordeten Mädchens sucht und ruft; die Stille im Treppen- 
haus, im Hinterhof und auf dem Dachboden markiert eine Abwesenheit, 
die sich später über den Blick auf den leeren Teller, den Ball, der davon- 
rollt, und den Ballon, der sich in den Hochspannungsdrähten verfängt, 
zur Todesgewissheit entwickelt. Auch in THE GREAT Caruso (USA 1951, 
Richard Thorpe, 0.01.44-0.06.22) verbindet sich die Todessymbolik der 
Stille mit dem Ziehen des Vorhangs zur Todesahnung, die später über 
das Glockenläuten bestätigt wird. Das Muster aus M — EINE STADT SUCHT 
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EINEN MÖRDER findet sich auch in Jaws (USA 1975, Steven Spielberg, 
0.12.58-0.17.23), in dem man nach dem Haiangriff nur noch die Mutter des 
Jungen hort, die den Namen ihres Kindes in die Stille ruft, wahrend die 
Wellen leise platschernd an den Strand schlagen. 

Eine der wenigen Szenen, in denen reine Stille ohne leise markie- 
rende Klangobjekte überhaupt zu hören ist, findet sich in Ropocop (USA 
1987, Paul Verhoeven, 0.22.22-0.27.17), in der ein ermordeter Polizist zum 
Cyborg umgebaut wird. Sterben, Operation und veränderte Wahrneh- 
mung des Cyborgs werden streng aus der Perspektive des Polizisten / 
Cyborgs gezeigt. Der Tod selbst ist ein Stück Schwarzfilm plus totale Stille, 
aus dem mit dem typischen Knistern eines hochlaufenden Monitors die 
technisierte Wahrnehmung des Cyborgs entsteht. 

Stille als Ausdruck von Trauer ist so weit verfestigt, dass diese Ver- 
bindung zur Klasse der Stereotype zu zählen ist. 


b) Unangenehme Gefühle, unterdrückte Konflikte, Peinlichkeit 


e RAGING Butt (USA 1980, Martin Scorsese, 0.37.49-0.39.22): Jakes Bru- 
der lauft Amok und zerhackt das Mobiliar in der Garderobe. 

e AMADEUS (USA 1984, Milos Forman, 0.34.57-0.44.57): Der Kaiser findet 
die Oper etwas zu modern, sie habe zu viele Noten. 

° ORLANDO (GB 1992, Sally Potter): 0.29.38-0.37.31): Orlando gibt sich der 
Poesie hin und heuert einen zweifelhaften Poeten an; (0.46.48-0.53.43): 
Die Orientalen erklaren England den Krieg; peinliche und unheimliche 
Stille markiert ihr Misstrauen. 

° THE PIANO (Neuseeland 1992, Jane Campion, 0.20.13-0.21.24): Stewart 
verabschiedet sich und äußert den Wunsch, dass Ada und er nach sei- 
ner Rückkehr einen Neubeginn versuchen könnten; die peinliche Stille 
ist Ausdruck des zerrütteten Verhältnisses zwischen Ada und ihrem 
ungeliebten Mann. 


Die Assoziation von Stille mit sozialen Konflikten ist signifikant häufiger 
in Werken zu beobachten, die sich tiefer gehend mit menschlichen Bezie- 
hungen auseinandersetzen. Sie fehlt in den Action- und Science-Fiction- 
Filmen meines Korpus völlig. 

Modellhaft für die subtilere Behandlung von Stille als Ausdrucksmit- 
tel von unterschwelligen zwischenmenschlichen Spannungen ist OUT OF 
AFRICA (USA 1985, Sydney Pollack), ein Film, der insgesamt eine leise, fein 
differenzierte Tonsprache pflegt. Innerhalb des Genres Biopic sind spezi- 
fische Konflikte zu beobachten. Einer dieser Grundkonflikte des biografi- 
schen Films ist das antagonistische Verhalten des Helden gegenüber einer 
Gemeinschaft; der Zuschauer wird zum Komplizen des Künstlers gegen- 
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über einer feindlichen Umwelt. Was in der Zeit als revolutionär erschien, 
kann retrospektiv angstfrei als gefestigte Würdigung verstanden wer- 
den, weil der Zuschauer den inzwischen approbierten Wert des Künstlers 
kennt. Der Nachruhm offeriert die tröstliche Perspektive einer postumen 
Würdigung. Das Leiden erhält so einen Sinn. 

Peinliche und leidvolle Situationen sind in OUT OF Arrica häufig. 
Eine Reihe von persönlichen Demütigungen erschweren das Leben der 
Schriftstellerin Karen Blixen, die sich jedoch immer wieder neu aufrap- 
pelt und unbeirrt weiterkämpft, auch wenn sie dabei gegen gesellschaft- 
liche Normen und Rollenerwartungen verstößt. In Nairobi angekommen, 
wird Blixen nur von einem afrikanischen Diener erwartet, der sie zu ihrem 
Mann Bror in einen Männerclub bringt, in dem die unerwünschte Frau 
peinliche Stille auslöst (0.04.04-0.10.40). Peinliche Stille herrscht auch, 
wenn Bror die Scheidung ihrer Ehe verlangt, die für Blixen mit immer 
neuen, unendlich erscheinenden Qualen verbunden war (diese Situa- 
tion ist weitgehend identisch mit der vergleichbaren Szene in THE PIANO) 
(1.56.02-1.57.49). Nachdem Brand in der Kaffeeaufbereitungsanlage ver- 
sucht Blixen verzweifelt, ein Stück Land für die Kikuyu zu finden; es 
gelingt ihr erst, als sie sich vor dem neuen Gouverneur auf die Knie wirft 
(2.05.22—2.12.04). 


c) Zirkuseffekt 


Die Stille wirkt als Antizipation einer Gefahr, die plötzlich mit großer 
Lautstärke hereinbricht. Es sind kurze, stille Pausen zwischen lauten Blö- 
cken, die eine Schrecksekunde markieren, in welcher die Figuren und wir 
vergessen zu atmen. Ich nenne diese Erscheinung Zirkuseffekt, weil sie mit 
dem abgebrochenen Trommelwirbel vor atemberaubenden Kunststücken 
im Zirkus vergleichbar ist. 

Prototypisch für diese Verwendung der Stille ist ein Angriff des 
Aliens auf Newt und die schlafende Ripley in ALTENS — THE RETURN (USA 
1986, James Cameron, 1.25.37-1.30.12). Ripley wacht auf, weil es still ist. 
Nur ein leises Tappen und ein undefinierbares, sehr hohes Sirren sind 
zu hören. Dann bewegt sich ein liegendes Glas ganz leicht, Ripley schaut 
sich suchend um, und mit leichter Verzögerung schlägt das Monster zu. 
Die Szene gehört zu einer Reihe von weiteren Angriffen nach demselben 
Strickmuster, das sich darüber weiter festigt und einen Lerneffekt im Sinne 
einer Konditionierung aufbaut. 

Weitere Szenen mit Stille als Zirkuseffekt: 


° ALL THE PRESIDENT'S MEN (USA 1976, Alan J. Pakula, 0.01.53-0.06.39): 
Einbruch ins Watergate-Bürohaus 
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RuMBLE FısHn (USA 1983, Francis Ford Coppola, 0.11.36-0.17.36): In 
der weiter vorne (> 211) beschriebenen Kampfszene ist eine solche 
Schrecksekunde vor dem brutalen Angriff mit einem Motorrad ein- 
geschoben, mit dem Motorcycle Boy einen Angriff auf seinen Bruder 
rächt. 

Rosocor (USA 1987, Paul Verhoeven, 0.05.55-0.12.33): Übertrieben 
diskrete, gedämpfte Geräusche im Vorfeld der Roboterdemonstra- 
tion fördern die Antizipation einer plötzlich hereinbrechenden Ka- 
tastrophe. 

THELMA & Louise (USA 1991, Ridley Scott, 0.10.58-0.18.03): Thelma 
verlässt mit Harlan, der sie zu vergewaltigen versucht, die Kneipe; vor 
Louises Schuss, mit dem sie den Widersacher töten wird, ein Moment 
der Stille. 


d) In Verbindung mit Desorientierung, vor allem im Showdown mit ste- 
reotyp unüberschaubarer Szenerie, zum Beispiel leere Fabrikhalle in der 
Dunkelheit. In der Stille macht nur irgendwo ein leises Geräusch auf den 
Feind aufmerksam. 


APOCALYPSE Now (USA 1979, Francis Ford Coppola): (0.48.09- 
1.04.36): Flussfahrt: Begegnung mit Tiger; (1.17.19-1.26.43): Nolan- 
Brücke; geisterhafte Stimmung mit totaler Desorientierung der Sol- 
daten 

PLATOON (USA 1986, Oliver Stone, 0.34.44-0.56.15): Grausamer Angriff 
auf vietnamesisches Dorf; Stereotyp: Tröpfeln entfernt verhallt zur 
Charakterisierung einer endlosen Höhle 

RoBocor (USA 1987, Paul Verhoeven, 1.03.53-1.12.00): Polizeischwa- 
dron soll Robocop vernichten, totale Desorientierung im Moment, als 
Robocop eine Tiefgarage betritt, in welcher die Polizeischwadron ihn 
erwartet 

THE HUNT FOR RED OCTOBER (USA 1990, John McTiernan, 1.43.12- 
2.02.30): In der visuellen Desorientierung während des Showdowns 
verrät ein Geräusch die Position des Feindes. 


Lautstärke als expressives Stilmittel 


Die Lautstärke wird dann zum expressiven Stilmittel, wenn sie sich in den 
beiden Extremen Lärm und Stille bewegt oder durch plötzlichen Wechsel 
gekennzeichnet ist. 


Die Verbindung Lärm — Aggression ist naheliegend. Auch wir werden 


laut, wenn wir aggressiv sind, genauso, wie wenn wir Opfer von Aggres- 
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sion werden. Die Tatsache, dass die bassigen Naturphänomene, die ich im 
Abschnitt Bässe (> 208) beschrieben habe, nicht nur tieffrequent, sondern 
auch sehr laut sind, lädt die Lautstärke zusätzlich mit einer mythischen 
Dimension auf, die im Begriff heiliger Lärm zugänglich wird. Dass dieser 
Lärm von der christlichen Kirche im Glockengeläut und im Orgelbrausen 
domestiziert wurde, um die christliche Gemeinde zu stiller Demut zu füh- 
ren, hat seinen Ursprung in einer völlig unchristlichen Tradition, die wie- 
derum im Begriff heidnischer Lärm zum Ausdruck kommt. Die Verbindung 
von Lärm und menschlicher Hybris, die im Mittelalter das Lautsein als 
etwas Unziemliches erscheinen ließ, geht auf die kriegerischen Erfahrun- 
gen mit den feindlichen Sarazenen zurück, welche den Lärm als Kriegslist 
einsetzten. Hammerstein (1986) berichtet, dass bereits die Griechen den als 
Hydraulis bezeichneten Vorläufer der Orgel sowohl zu kultischen Zwecken 
im Theater und im Tempel einsetzten als auch damit in den Krieg zogen. 
In einer arabischen Quelle wird das Instrument mit dem Beinamen «mit 
dem weiten Maul und dem lauten Klang» versehen. «Es heißt so, weil 
sich sein Klang auf 60 Meilen erstreckt» (Hammerstein 1986: 60). Der laute 
schauererregende Schall soll «Schrecken verbreitet und die Herzen derer, 
die ihn hörten, zerspringen lassen haben. Die Männer, die die Blasebälge 
treten, verstopfen ihre Ohren mit Watte, und darüber sind diese noch mit 
Wachs bestrichen, damit ihr Verstand nicht entweiche und dass ihr Gehör 
nicht Schaden leide» (Hammerstein 1986: 61). Hammerstein zitiert weitere 
Quellen, die allesamt die Furcht einflößende, gewaltige Wirkung dieser 
akustischen Kriegsmaschinen beschreiben. 

Die beiden Pole Kult und Krieg, deren gemeinsames Bestreben es ist, 
Lärm als Machtmittel zu benutzen, kennzeichnen das Spannungsfeld, in 
dem sich Lautstärke als kulturelles Phänomen ansiedeln lässt. Exaltierte 
Lautstärke ist das wichtigste Mittel, die Rezipienten nach behavioristi- 
schem Schema in einen unausweichlichen Reiz-Reaktions-Mechanismus 
zu zwingen. Als Kult waren es in den 1960er-Jahren die Rockkonzerte, die 
diesen Mechanismus übernahmen und perpetuierten. «Die Lautsprecher 
sind aufgerichtet wie Totems, aggressiv sichtbar, die menschlichen Körper 
werden von Vibrationen geschüttelt, Gespräche unmöglich: Man kann nur 
trinken oder tanzen»* (Auriol 1991: 115). Den extremen Reiz, wie er sich 
auch in der populären Musikkultur seit den 1960er-Jahren etabliert hat, 
kann man nur genießen, wenn man ihn sucht. Im Kino wissen wir aus 
Erfahrung, dass ein gewisser Schwellenwert nicht überschritten wird und 
dass auf die extreme Reizung die erlösende Entspannung folgt. Wird man 


4 «Les haut-parleurs sont érigés comme des totems, agressivement visibles, les corps 
humains sont secoués de vibrations, les conversations impossibles: on ne peut que 
boire ou danser.» 
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hingegen unfreiwillig gleichen Pegeln mit negativer Konnotation ausge- 
setzt, fällt die positive Belohnung weg, und die Lautstärke wird nur als 
Lärm empfunden. 

Es gibt keine mentale Strategie, um der Wirkung exaltierter Laut- 
stärke auszuweichen. Sie übt einen unmittelbaren und unwillkürlichen 
Einfluss auf die psychischen und vegetativen Funktionen aus, und zwar 
unabhängig von der Beschaffenheit und Bewertung des Reizes (Rudolph 
1993: 33). «Je nach Ausgangslage des Organismus treten bei akustischen 
Reizen ab ca. 60dB unwillkürlich Aktivierungsreaktionen auf, die sich 
in Blutdruckerhöhung, Herzfrequenzsteigerung, Verengung der Kapilla- 
ren, erhöhtem Muskeltonus, Pupillenerweiterung etc. zeigen» (Rudolph 
1993: 79). 

Ein weiterer Aspekt des Reiz-Reaktions-Mechanismus, der von der 
Lautstärke ausgelöst wird, wurde 1958 von Broadbent im Filtermodell 
postuliert. Broadbent entdeckte bei der Untersuchung, dass eine durch 
Lärm induzierte Erhöhung des Erregungsniveaus zu einer Leistungsver- 
schlechterung führt (van der Molen 1996: 341). Er führte diese Beobach- 
tung auf die beschränkte Kapazität des kognitiven Systems zurück, das bei 
Einwirkung von Lärm nicht in der Lage ist, den akustischen Reiz auszufil- 
tern, auch wenn er irrelevant ist, wodurch die Verarbeitung der relevanten 
Information blockiert wird. Mit anderen Worten verhindert die Einwir- 
kung von großer Lautstärke die simultane Verarbeitung von anderen Rei- 
zen und damit auch die freie und aktive Informationssuche. 

Diese unwillkürlichen reflexartigen Reaktionen des Körpers im Ver- 
bund mit der alles zudeckenden Dominanz der Lautstärke, die das reflek- 
tierende Denkendes Rezipienten ausschalten, wurden im Kino schon 
bemerkenswert früh genutzt, um das Publikum in die Sessel zu drücken. 
Bereits die Meuterei in THE Bric House (USA 1930, George Hill, 1.07.38- 
1.25.30), die Gerichtsszene in M — EINE STADT SUCHT EINEN MORDER 
(Deutschland 1931, Fritz Lang, 1.28.48-1.42.45), sehr viele Sequenzen in 
Kinc Kong (USA 1933, Cooper/Schoedsack) — von Anns Entführung bis 
zum Showdown in New York - sind überdurchschnittlich laut. Tatsäch- 
lich lässt sich statistisch kaum ein quantitativer Unterschied zwischen der 
Verwendung von Lautstärke vor und nach 1975 feststellen. In beiden Fäl- 
len tritt in rund 18% aller Szenen extreme Lautstärke in den Vordergrund. 
Nun ist allerdings Lautstärke immer ein relativer Faktor, der nicht isoliert 
betrachtet werden darf. Wie bereitsdargestellt, ist sie nur im Verbund mit 
der Frequenzdistribution zu sehen. Als weiterer Faktor spielt die Dichte 
des akustischen Materials eine wichtige Rolle, das heißt, wie viele Klang- 
objekte gleichzeitig präsent sind und einander überlagern. Entscheidend 
dürften allerdings die technischen Begrenzungen von Speichermaterial 
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und Wiedergabeapparatur fiir die Empfindung einer standig zunehmen- 
den Lautstärke im Kino sein. Das heißt, was im Kontext der analogen 
Lichttonspur eines King Kong als laut empfunden wurde, würde im Kon- 
text der digitalen Tonspur von Jurassic PARK (USA 1993, Steven Spielberg) 
verblassen. Objektiv, in Dezibel ausgedriickt, hat seit Beginn der Tonfilm- 
zeit die Lautstärke stetig zugenommen. Nicht die Anzahl lauter Szenen 
hat sich verändert, sondern das Ausmaß der physikalisch messbaren Para- 
meter. 

Eine weitere Strategie, die seit Mitte der 1970er-Jahre das subjektive 
Empfinden von massiver Lautstärke unterstützt, ist die Kombination von 
Lautstärke und Dauer. Aufgrund der Ermüdungserscheinungen, welche 
die maximale Lautstärke auslöst, nimmt der Stress mit länger dauernder 
Exposition zu. Spitzenreiter dieser Strategie ist TERMINATOR 2 (USA 1991, 
James Cameron), dessen endloser Showdown sich während 40 Minuten 
immer am Limit zulässiger Pegel bewegt. In den meisten Filmen jedoch 
sind diese Spitzenpegel den Momenten größter Krise vorbehalten, die 
allein schon aus einer ökonomischen Behandlung expressiver Stilmittel 
äußerst selten sind und in der Gesamtdramaturgie einige wenige Höhe- 
punkte markieren. Dann werden alle Bereiche gleichzeitig bis an die 
Grenze der überhaupt noch prozessierbaren Pegel gepusht. 

Extreme Lautstärke greift auch auf die anderen Sinne über: Auriol 
(1991: 116) beschreibt Gleichgewichtsstörungen, Schwindelgefühle, opti- 
sche Phantomerscheinungen, Schmerzen. Über diese Nebeneffekte wird 
Lautstärke zum totalen Erlebnis, welches zu tranceartigen Zuständen und 
dem phasenweisen Verlust der Selbstkontrolle führt. «Wir befinden uns 
nicht mehr im Bereich von «Realismus» oder «Reflexion», sondern erfahren 
die Kinosituation in erster Linie körperlich und deshalb eher als Selbst- 
zweck denn als Mittel zum Zweck, sei das nun politisch, referenziell oder 
wie auch immer»? schreibt Elsaesser (1998: 196) zur bereits erwähnten 
Überflutung (engulfment) im zeitgenössischen Hollywood-Kino. 

Die Transgression der symbolischen Funktion kinematografischer 
Repräsentation wird besonders im Fall der Lautstärke evident. Lautstärke 
verlässt den darstellenden Code des Kinos als einer gerahmten Altarkunst, 
sie hat keine Stellvertreterfunktion mehr für eine dahinterliegende Wirk- 
lichkeit, sondern sie ist diese Wirklichkeit. Ein Zitat aus Batesons Ökologie 
des Geistes (1972: 246) soll diese Differenzierung erhellen: «Drohung ist ein 
[...] Phänomen, das dem Spiel darin ähnelt, daß Handlungen zwar andere 
Handlungen bezeichnen, sich von ihnen aber unterscheiden. Die drohend 


5 «Weare no longer in the episteme of «realism or <reflection>, but encounter the cinema 
experience as first and foremost a bodily one, and thus an end in itself, rather than a 
means to an end, political, representational or otherwise.» 
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geballte Faust ist etwas anderes als der Schlag, aber sie bezieht sich auf 
einen möglichen zukünftigen (aber gegenwärtig noch nicht existierenden) 
Schlag». Um in Batesons Bild zu bleiben: Exzessive Pegel sind nicht mehr 
die geballte Faust als Drohgebärde, sondern der physisch wahrnehmbare 
Impakt des Schlags. Die emotional befrachtete Erfahrung von Ekstase 
scheint für manche Rezipienten eine wichtige Strategie zur Affektregu- 
lierung durch totale sensorische Beanspruchung zu sein (Tan 1996: 24f.). 
Das lustvolle Erleben von heftigen Reizen muss jedoch auch an spezifische 
Persönlichkeitsmerkmale gebunden sein. Die Verfasserin dieser Arbeit 
beispielsweise ist nicht in der Lage, diesen Genuss zu empfinden, sondern 
begegnet dem martialischen Einsatz von rohem Pegel mit Skepsis. Aus 
wissenschaftlicher Neugier in einem Film wie SAVING PRIVATE RYAN (USA 
1998, Steven Spielberg) sitzend, fasziniert von der überaus kunstvoll ange- 
legten Tonspur, die Gary Rydstrom gestaltet hat, ist es das massive Bom- 
bardement mit Lautstärke, das als eine Art Boomerang-Effekt Distanz und 
Abscheu auslöst. Aus meiner Sicht haftet der brutalen Lautstärke immer 
ein Aspekt des brachialen Zwangs an, den ich aus tiefster Seele ablehne. 
Die Dimension des Zwangs wird von den bereits dargestellten unwillkür- 
lichen Reaktionen und der Blockierung aktiver Informationsaufnahme 
(> 239) aus psychologischer Sicht erklärt. Meine Skepsis teilen überdies 
alle meine Interviewpartner, Sound Designer und Mischtonmeister, die in 
der Lautstärke an sich keinen Wert sehen, sondern generell für eine öko- 
nomische Verwendung großer Pegel plädieren, jedoch immer wieder von 
Regisseuren und Produzenten an die Grenzen des Erträglichen getrieben 
werden, wie siein Übereinstimmung berichten. Zwei von ihnen haben bei 
der Arbeit schwere Gehörschädigungen erlitten: Richard Beggs (1997) bei 
der Mischung von STRANGE Days (USA 1995, Kathryn Bigelow), Milan Bor 
bei der Mischung der digitalen Kriegsgeräusche zu STALINGRAD (Deutsch- 
land 1993, Joseph Vilsmaier) sogar einen irreparablen Tinnitus, der ihn 
arbeitsunfähig machte. 

Tan (1996: 25) zitiert außerdem eine Untersuchung von Zillmann 
(1988) zur Motivation bestimmter Arten von Medienkonsum. Diese Stu- 
die stellt einen Zusammenhang zwischen reizlosem, unterstimulieren- 
dem Alltag und der Suche nach vielfältigen, erregenden Stimuli in der 
Medienrezeption her. Dieser Aspekt wird in der Literatur sehr kontrovers 
diskutiert. Als generelle Linien sind die positive Bewertung des katharti- 
schen Effekts extremer Stimulation und die Theorie des sozialen Lernens 
zu nennen. Mit Katharsis, einem Begriff, der auf Aristoteles zurückgeht, 
ist die reinigende Wirkung gemeint, welche über die fantasierte Partizi- 
pation an extremen Situationen ein Gefühl der Entspannung herbeiführt, 
mithin unbewältigte aggressive Tendenzen dadurch abbaut, dass sie den 


242 Dynamik 


Rezipienten zusätzlich mit aggressiven Reizmomenten konfrontiert (Wuss 
1993: 379). Die Theorie des sozialen Lernens hingegen postuliert, dass die 
extreme Erfahrung im Medienkonsum bereits vorhandene negative Emo- 
tionen verstärke (Tan 1996: 27). 

Mit der Kenntnis psychoakustischer Gegebenheiten wurden in der 
Musikindustrie elektronische Peripheriegeräte entwickelt, um die senso- 
rische Dimension des Klangs optimal aufzubereiten, unter anderem ein 
sogenannter Aural Exciter, der durch minutiös berechnete Verzerrungen in 
den Höhen die Lautstärkeempfindung über den messbaren Pegel hinaus 
pusht. Weiter wird insbesondere der Bassbereich seit Mitte der 1970er- 
Jahre in den sogenannten Babyboomer-Formaten, die über einen eigenen 
Basskanal verfügen, mit Pegeln bis 115 dB (Holman 1997: 209) massiv aus- 
genutzt, um das Gefühl von markerschütternder Lautstärke zu erzeugen. 
Über die spektakuläre Dimension des technischen Inventars hat sich der 
zeitgenössische Kinoton vom klassischen Paradigma verabschiedet, dass 
der kinematografische Apparat verborgen werden müsse, um den Film 
nicht als Artefakt erscheinen zu lassen. In dem Moment, wo die Reizgröße 
als solche zur Botschaft wird, tritt ein anderes Konzept auf den Plan. Der 
Kinoapparat ist nicht länger Mittel zum Zweck, sondern erhält eine magi- 
sche Dimension. Hammerstein (1986), der die Entstehungsgeschichte 
tönender Automaten in der Antike untersucht hat, schreibt, dass die Grie- 
chen die Herstellung von Maschinen als eine göttliche Kunst verstanden. 
Sie fassten den Kosmos selbst, die geordneten Bewegungen der Himmels- 
körper und die schon von ihnen beobachtete Harmonie der Sphären als 
eine Art Riesenautomat auf. Diese Vorstellung, die sich unter anderem bei 
Plato findet, die Aristoteles jedoch infrage stellte, wurde in römischer Zeit 
wieder aufgenommen. Hammerstein (1986: 14) zitiert aus Ciceros Som- 
nium Scipionis die Wahrnehmung einer Sphärenharmonie, «deren Klang 
so gewaltig ist, dass der Mensch ihn nicht zu hören vermag» - also jen- 
seits der oberen Hörschwelle. Und so wird einmal mehr deutlich, dass 
die modernsten Erscheinungen oft die archaischsten Wurzeln haben. Die 
Verquickung von Maschine, Kult und Krieg scheint weiter in den futuris- 
tischen Manifesten und in der russischen Geräuschkunst auf (Musikalisie- 
rung der Tonspur — 264). 

Die zahlreichen Dokumentarfilme über Dreharbeiten und Postpro- 
duktion, die als Making of seit geraumer Zeit Teil der Marketingstrategie 
geworden sind, wenden sich an ein technikbegeistertes Publikum, das die 
Virtuosität des Apparats selbst als Genuss empfindet. 

Lärm = Macht - diese Gleichung geht nicht nur kulturhistorisch auf, 
sondern gründet auch auf der psychophysischen Gesetzmäßigkeit, dass 
man laute akustische Ereignisse bevorzugt wahrnimmt. Ordnet man die 
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Aufmerksamkeitsroutinen, die von der Gestaltpsychologie angenommen 
werden, nach akustischen Kriterien, kommt der Lautstarke erste Prioritat 
zu. Was über größere Power verfügt, schiebt sich in den Vordergrund der 
Wahrnehmung, maskiert das Leise und drängt es aus dem Bewusstsein. 
Tonspuren sind in der Verteilung der Lautstärke deshalb sehr selektiv. Die 
Bereiche Sprache, Geräusche oder Musik werden je nach situativer Bedeu- 
tung durch entsprechende Pegel betont, welche die Hierarchie sichern und 
die Wahrnehmung lenken oder sogar diktieren. Die individuelle Zufällig- 
keit, mit welcher der Zuschauer in den einzelnen Bereichen herumwan- 
dert, wird durch die Manipulation des Pegels eingeschränkt und gleich- 
geschaltet. Die Idee eines demokratischen Tons, wie sie die Nouvelle vague 
praktizierte, wo verschiedene Segmente in einem spannungsgeladenen, 
unsortierten Verhältnis zueinanderstehen, beruht auf dem Widerspruch 
zum klassisch-hierarchischen System, das den Zuschauer wie an einer 
unsichtbaren Leine durch die Klangsphären führt. 

Die akustische Dynamik, das heißt, die Spannung zwischen größtem 
und kleinstem Pegel und die Organisation der Pegel dazwischen, kann als 
Gegenstück zur Perspektive des Bildes aufgefasst werden. Ähnlich wie 
die Perspektive ist sie ein strukturelles Mittel zur Organisation des akus- 
tischen Raums, das den Hörer unausweichlich zu einer spezifischen Les- 
art zwingt. Diese Schichtung wird uns in der Diskussion des Hörpunkts 
(> 367) nochmals eingehender beschäftigen. 

Exzessive Lautstärke korreliert im Kino überdurchschnittlich häu- 
fig mit negativ besetzten Emotionen wie Aggression und Anspannung. 
Kampf- und Kriegsszenen, Showdowns und Verfolgungsjagden sind laut- 
starke Höhepunkte. Als Beispiele von hohem Pegel mit positiver Grund- 
stimmung sind ausschließlich Montagesequenzen zu finden, die von 
dominanter, euphorischer Musik begleitet werden: die Flussfahrt in Frei- 
zeitstimmung zum Song «Satisfaction» der Rolling Stones in APOCALYPSE 
Now (USA 1979, Francis Ford Coppola, 0.21.31-0.23.11), ein trügerischer 
Moment der Entspannung vor dem Sturm, oder die berühmte Fahrrad- 
fahrt am nächtlichen Himmel in E. T. — THE EXTRATERRESTRIAL (USA 1982, 
Steven Spielberg, 1.01.58-1.02.47). 


8 Wahrnehmung komplexer 
akustischer Muster 


Aufmerksamkeit und Selektion 


Angesichts der komplexen Schichtungen auf zeitgenössischen Tonspuren 
stellt sich die Frage, wie Rezipienten den Überfluss an Information über- 
haupt kognitiv bewältigen können. Nach welchen Kriterien ordnen sie 
die verschiedenen Klangobjekte? Lassen sich allgemeingültige Prinzipien 
beschreiben, oder überwiegen individuelle Ordnungsstrategien? 

Zentrale Konzepte zum Verständnis der Wahrnehmung komplexer 
Reizmuster sind die Begriffe Aufmerksamkeit und Selektion. Zwischen Auf- 
merksamkeit und Selektion besteht ein Zusammenhang: Beide ergeben 
sich aus der Notwendigkeit, ein komplexes Reizangebot so zu strukturie- 
ren, dass der Informationsfluss den biologischen Gegebenheiten des zen- 
tralen Nervensystems und den Anforderungen des Organismus optimal 
entspricht. Interessanterweise wenden psychologische Studien zu die- 
sen Konzepten vielfach auditive Experimente an, weil die Anforderung 
zur Echtzeitverarbeitung im auditiven Modus sehr exakte Rückschlüsse 
über den Zusammenhang zwischen dem Auftreten eines Reizes und den 
anschließenden Reaktionen zulässt. 

Relativgut bekannt ist der Cocktailparty-Effekt, der erstmals 1953 durch 
den Akustiker Colin Cherry beschrieben wurde und eine selbstverständ- 
lich erscheinende Fähigkeit des auditiven Apparats untersucht. Auch in 
dichten akustischen Klangmischungen können wir das Gehör auf einzelne 
Informationen fokussieren, die uns interessieren. Die Fokussierungsfähig- 
keit des Ohrs in der Cocktailparty-Situation wird vom Gehirn gesteuert 
und ist entsprechend stark mit psychischen Vorgängen verknüpft. Wei- 
ter ist diese Funktion eng an die semantische Ebene gebunden. Fehlende 
Bruchteile werden aufgrund des Bedeutungszusammenhangs ergänzt. 
Dieser Prozess gründet auf dem Bedürfnis nach verständlichen, sinn- 
vollen Ganzheiten. Einen solchen Prozess können wir beim Musikhören 
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beobachten. Je nach Interessenslage, musikalischer Bildung oder psychi- 
scher Verfassung können wir einzelnen Stimmen folgen, uns auf Motive 
konzentrieren oder auf rhythmische Elemente reagieren. Wir hören die 
Musik beiläufig als Ganzes oder wandern sozusagen analytisch darin 
herum. In natürlichen Lautsphären programmieren wir unsere Aufmerk- 
samkeit auf einzelne Segmente, die wir als besonders wichtig erachten. 
Das kann die Haustüre sein, wenn man erwartet, dass jemand nach Hause 
kommt, das kann für eine Mutter das nächtliche Wimmern ihres Kindes 
sein oder für den Jäger, der einem Wild auflauert, das Knistern von bre- 
chenden Zweigen. 

Anatomisch wird die Fähigkeit zum fokussierten Hören durch die 
efferenten Fasersysteme ermöglicht, die umgekehrt gepolt sind und eine 
erregungshemmende Funktion haben, indem sie die äußeren Haarzel- 
len zu einer Eigenbewegung motivieren (Keidel 1975: 13 f.; Buser/Imbert 
1987: 110), und zwar auf der Basis eines bestimmten Frequenzbandes 
(Leek 1987: 278). 

In Cherrys Untersuchung zum Cocktailparty-Effekt wurden den 
Probanden zwei einander überlagernde Mitteilungen zugespielt, mit der 
Aufgabe, nur die eine Mitteilung zu beachten und verbal wiederzugeben. 
Diese Aufgabe gelang den Hörern kaum, wenn die Mitteilungen vom sel- 
ben Sprecher stammten und einander in Mono überlagert wurden, weil 
Cherry mit dieser Anordnung den Probanden sämtliche Parameter ent- 
zog, die in einer natürlichen Situation die Unterscheidung erleichtern: 
Tonhöhen- und Klangfarbenunterschiede, Laufzeitdifferenzen und Laut- 
stärke. Die Leistungen verbesserten sich, wenn die Probanden den Text 
mehrmals hörten, sodass sie sich mit zunehmendem Training an der 
semantischen und syntaktischen Struktur der Sprache orientieren konn- 
ten. Vor allem nahm die Unterscheidungsfähigkeit dann sprunghaft zu, 
wenn die Mitteilungen über Kopfhörer beiden Ohren getrennt zugespielt 
wurden. Diese so genannt dichotische Darbietung ist seither ein Standard- 
layout der experimentellen Untersuchung zur Steuerung der Aufmerk- 
samkeit. Schon Cherry bemerkte außerdem einen Einfluss klanglicher 
Parameter auf die selektive Aufmerksamkeit. 

Einen entscheidenden Impuls zur vertieften Beschäftigung mit der 
Aufmerksamkeit lieferte Broadbent (1958) mit dem Filtermodell. Broad- 
bent orientierte sich am informationstheoretischen Ansatz von Shannon/ 
Weaver (1948), der die menschliche Kommunikation analog zum Informa- 
tionsfluss in den technischen Medien Radio und Telefon als eine Sender- 
Empfänger-Konstruktion auffasst. Broadbents Filtermodell basiert im 
Wesentlichen auf der Annahme einer begrenzten Kapazität des Nerven- 
systems, das innerhalb eines gegebenen Zeitraums nur eine bestimmte, 
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klein dimensionierte Anzahl von Informationen verarbeiten kann. Um 
das Reizverarbeitungssystem vor Überlastung zu schützen, war in die- 
sem Modell ein Filter vorgesehen, der die nicht relevanten Informationen 
aussondert. In experimentellen Studien stellte er fest, dass mehrere Infor- 
mationen dann gleichzeitig verarbeitet werden können, wenn sie einfach 
strukturiert sind; mit zunehmender Komplexität wird das System zur 
Selektion gezwungen. Es muss jedoch vermerkt werden, dass bei Broad- 
bent die Zielreize ausschließlich sprachlicher Natur waren, die Probanden 
also ihre Aufmerksamkeit nur auf die Bedeutungsebene von sprachlichen 
Mitteilungen lenken mussten, während andere Parameter irrelevant blie- 
ben. Es zeigte sich jedoch selbst in solchen Situationen, dass einige phy- 
sikalische Eigenschaften des Schalls sowie die irrelevanten Informatio- 
nen nicht vollständig ausgeblendet wurden; unter anderem konnten die 
Probanden retrospektiv Angaben über die klangliche Beschaffenheit der 
Sprache, das Geschlecht der Sprecher oder auffällige klangliche Verände- 
rungen machen. 

Eine entscheidende Rolle für die Begrenzung der Kapazität spielte 
das Kurzzeit- oder Arbeitsgedächtnis. Broadbent postulierte, dass in die- 
ses Gedächtnis weniger als zehn Einheiten zwischengelagert werden kön- 
nen. Die kapazitätsvermindernde Eigenschaft des Arbeitsgedächtnisses 
besteht außerdem darin, dass dort gespeicherte Informationen nach weni- 
gen Sekunden gelöscht werden. Die Größe der gespeicherten Einheiten 
oder vielmehr ihr Informationsgehalt spielt dabei keine Rolle; deshalb 
sind Strategien zur Bildung von größeren Einheiten sehr wirkungsvoll, 
um den Informationsfluss zu verbessern. Sie werden als Chunks bezeich- 
net, mit deren Funktion ich mich im Kapitel Orientierung (> 307) genauer 
beschäftigen werde. Das Arbeitsgedächtnis war in diesem Modell dem Fil- 
ter vorgeschaltet. 

Am Filtermodell wurden später einige Grundannahmen kritisiert, 
vor allem sein Alles-oder-nichts-Charakter und die Beschränkung der 
Untersuchung auf willkürliche Aufmerksamkeitssteuerung (Neumann 
1996, O’Donnell/Cohen 1993). Broadbent selbst akzeptierte diese Kritik 
und erweiterte sein Filterkonzept um den Begriff des Einsortierens (pigeon- 
holing). Darunter verstand er die aktive Zuordnung von sensorischen 
Daten zu bereits bestehenden Kategorien. Im Gegensatz zum Filter, den 
er auf einer niederen Stufe der Reizverarbeitung ansetzte, erfordert das 
Einsortieren die komplexe Analyse diverser Merkmale auf einer höheren 
Stufe. Mit der Idee des Einsortierens werde ich mich später unter dem 
Stichwort Streaming (> 253) intensiver befassen. Weiter modifizierte er die 
Filtermetapher dahingehend, dass sie nicht mehr als komplettes Ausblen- 
den, sondern vielmehr als Dämpfung nicht relevanter Reize verstanden 
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wird. Diese Modifikation bedeutet, dass das System auf vorerst ausgeblen- 
dete Sinnesdaten zuriickgreifen kann, wenn die Prozessierung auf einer 
höheren Integrationsstufe einen solchen Rückgriff nahelegt. 

Broadbents Modell ist nicht nur von historischem Interesse, son- 
dern dient auch weiterhin der Veranschaulichung von Grundlagen eines 
Prozesses, der von der späteren Forschung in diverse Teilbetrachtun- 
gen aufgespaltet wurde. Wie Neumann (1996: 559 ff.) darstellt, wurde 
die Modellbildung ab Mitte der 1960er-Jahre von der Computertechnik 
beeinflusst. 

Eine Reihe von Experimenten (ten Hoopen 1996: 118 ff.) ergaben, dass 
die semantische Ebene bei der Steuerung der Aufmerksamkeit über phy- 
sikalische Parameter dominiert. Diese Beobachtung führte zur Hypothese 
der späten Selektion, die im Gegensatz zu Broadbents Modell eine Selektion 
nach der Analyse semantischer und sensorischer Dimensionen postuliert. 
Inzwischen hat sich die sogenannte Multilokalisationstheorie etabliert, nach 
welcher unterschiedliche Stufen bei der Selektion zusammenspielen. Im 
Gehirn lässt sich kontrollierte Aufmerksamkeit als Anstieg des langsamen 
Rindenpotenzials im negativen Bereich messen. Dieser Anstieg findet vor 
der Darbietung der Aufgabe statt und wird während der Bearbeitung zu 
kortikaler Positivierung. Diese Resultate, die mit nicht invasiven Mess- 
methoden am gesunden Gehirn des Menschen gefunden werden, lassen 
darauf schließen, dass «jeder Reiz, auch wenn er nicht bewusst wahrge- 
nommen wird, vor Zuteilung von Aufmerksamkeitsressourcen vom Neo- 
kortex analysiert wird» (Birbaumer/Schmidt 1993: 391). 

Weiter hat sich auch das Kapazitätsproblem ausdifferenziert: Seit 
Mitte der 1960er-Jahre wird die beschränkte Kapazität nicht mehr als Eng- 
pass in einer einkanaligen Informationsprozessierung, sondern als knap- 
per Vorrat interpretiert (Neumann 1996: 576). Die Vorratsmetapher unter- 
scheidet sich vom Flaschenhalsmodell insofern, als ein Kapazitätsvorrat 
auf verschiedene Tätigkeiten gleichzeitig aufgeteilt werden kann. Diese 
verschiedenen Tätigkeiten können in unterschiedlichem Maß miteinander 
interferieren. Ähnliche Aufgabenstellungen in einem spezifischen Modus 
interferieren stärker als unterschiedliche Aufgabenstellungen in verschie- 
denen Modalitäten. Das bedeutet auf unseren Gegenstand angewendet, 
dass es schwieriger ist, mehrere akustische Informationen simultan zu ver- 
arbeiten als gleichzeitig dargebotene optische und akustische Reize; mit 
anderen Worten, dass die simultane Verarbeitung komplexer Reizstruktu- 
ren leichter fällt, wenn Auge und Ohr daran beteiligt sind. 

Interferenz ist beispielsweise deutlich spürbar in der Situation des 
dichotischen Hörens. Hingegen bereitet es keine Schwierigkeiten, einem 
Text zuzuhören und gleichzeitig der Aufgabe nachzukommen, ein Tier zu 
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zeichnen. Weiter lässt sich die Interferenz durch Übung abbauen, indem 
einzelne Tätigkeiten automatisiert werden. Eine solche Automatisierung 
nehme ich bei der Verarbeitung von Stereotypen an (> 176). Insbesondere 
Neisser (1976) schrieb das Interferenzproblem nicht der begrenzten Kapa- 
zität zu, sondern erkannte darin ein Problem der Koordination von ver- 
schiedenen Teilsystemen. 

Seit Mitte der 1980er-Jahre wird die Selektion nicht mehr als ein 
Schutzmechanismus aufgefasst, sondern als ein biologisch sinnvoller 
Prozess zur Verstärkung verhaltensrelevanter Informationen (Neumann 
1996: 596). Auch hier hat sich ein Modell etabliert, das verschiedene Pro- 
zesse miteinander koordiniert. Im Modell der konnektionistischen Netze 
(> 111) werden sowohl Prozesse der Bahnung als auch inhibitorische Pro- 
zesse der Hemmung angenommen, welche den Informationsfluss koordi- 
nieren. 


Willkürliche Aufmerksamkeit 


Ein wichtiger Aspekt der Selektion blieb in der frühen Modellbildung 
unberücksichtigt: die willentliche Steuerung der Aufmerksamkeit. Zwar 
waren die experimentellen Untersuchungen mit einer spezifischen Aufga- 
benstellung verknüpft, welche die Aufmerksamkeit einem definierten Ziel 
unterordnete. Obwohl dieses Ziel den Selektionsmechanismus deutlich 
beeinflusste oder ihn sogar weitgehend kontrollierte, rückte der Aspekt 
der intentionalen Zuwendung nicht in den Fokus der Forschung. Erst in 
den 1970er-Jahren wurden sogenannte Zwei-Prozess-Theorien entwickelt, in 
welchen zwischen automatisierten und gesteuerten Prozessen unterschie- 
den wurde. Damit wurde auch klar, dass Einstellungen, Motivationen, 
Hypothesen und Antizipationen die gesteuerte Aufmerksamkeit beein- 
flussen. Die Aufmerksamkeit hängt demnach mit zentralen Prozessen der 
Reizinterpretation und der aktiven Konstruktion einer kohärenten Reprä- 
sentation zusammen. 

Eine solche aktive Aufmerksamkeitssteuerung wird auch als Top- 
down-Prozess bezeichnet. Dieser Begriff hat sich besonders in der Filmtheo- 
rie etabliert, wo er unter anderem von Bordwell (1985, 1991) verwendet 
wird, um die aktive Suche des Rezipienten auf der Basis von Hypothesen 
und Prädispositionen zu beschreiben. 


O’Donnell/Cohen (1993: 32 f.) unterscheiden folgende Einflüsse: 


° Voreinstellung (preparatory set): Das Subjekt wird darauf vorbereitet, 
dass ein bestimmter Reiz eintreffen wird. In der Filmwahrnehmung 
können das stereotype Abläufe sein wie zum Beispiel die zunehmende 
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Stille vor einer Katastrophe, die ich unter dem Stichwort Zirkuseffekt 
beschrieben habe (> 236). Die Voreinstellung führt zu einer generell 
gesteigerten Aktivierung, aufgrund derer das narrative Material inten- 
siv nach bestimmten Merkmalen abgesucht wird. Besonders setzt es 
jedoch die Aktivierung mentaler Repräsentationen aus dem Langzeit- 
gedächtnis als willentlichen Prozess voraus, wenn man auf ein spezi- 
fisches Klangobjekt wartet. Eine Lautsphäre wird dann nach aufgaben- 
relevanten Klangobjekten durchsucht. Die mentale Repräsentation 
eines Bündels spezifischer Charakteristika setzt die intensive, länger 
dauernde Beschäftigung damit voraus. Leek (1987: 279) stellte in ihren 
Untersuchungen fest, dass Hunderte (!) von Trainingsstunden nötig 
waren, bis sich die Unterscheidungsfähigkeit der Versuchspersonen 
merklich verbesserte. 

Wahrscheinlichkeit (event probabilities): Wahrscheinlichere Begeben- 
heiten werden leichter verarbeitet als unwahrscheinliche. Die Wahr- 
scheinlichkeit spielt zum Beispiel bei der klanglichen Konstruktion 
von Schauplätzen eine Rolle, die ich im Kapitel Orientierung (> 298) 
beschreiben werde. Es sind organisierte Sequenzen, die hauptsächlich 
auf der Integration von wahrscheinlichen Abläufen beruhen. Solche 
Strukturen beeinflussen die Erwartungshaltung hinsichtlich der weite- 
ren Entwicklung der Handlung maßgeblich. 

Priming: Die Wirkung des Primings habe ich im Abschnitt über das Leit- 
motiv (> 186) bereits beschrieben. Das Priming — Bordwell (1985: 38) 
nennt es primacy effect — öffnet ein semantisches Register, in das nachfol- 
gende Daten eingepasst werden. Meiner Auffassung nach beginnt das 
Priming schon vor dem Kinobesuch: Informationen wie der Filmtitel, 
der Regisseur, Medienberichte, Plakate und Standbilder stellen ein be- 
stimmtes Bedeutungsfeld zusammen, in das die Filmrezeption integ- 
riert wird. Wenn wir in einen Film namens JurAssIc PARK von einem 
Regisseur namens Steven Spielberg gehen, wissen wir im Allgemeinen 
schon, dass er von Dinosauriern handelt. Wir wissen möglicherweise 
sogar, dass diese Dinosaurier außer Kontrolle geraten (was schon eher 
eine Voreinstellung wäre). Wir kennen andere Filme von Spielberg, die 
erwarten lassen, dass das Thema Dinosaurier nicht unter wissenschaft- 
lichem Aspekt, sondern als Spannung pur abgehandelt werden wird. 
Das Priming spielt außerdem eine wichtige Rolle in Expositionsszenen, 
in welchen nicht nur ein semantisches Register geöffnet, sondern auch 
eine formale Struktur etabliert wird, welche den Rezipienten einstimmt 
und die weitergehende Interpretation des Geschehens beeinflusst. Der 
Priming-Effekt kann im Lauf der Filmwahrnehmung zerfallen oder 
modifiziert werden. 
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° Mentale Repräsentationen und Erwartungshaltung: Cohen/O’Donnell 
verwenden in Anschluss an Neisser (1976) für mentale Repräsentatio- 
nen den Begriff Schema, der auch von Bordwell (1985, 1991) favorisiert 
wird. Die Erwartungshaltung wird wesentlich durch einen ständigen 
Abgleich eingehender Reize mit mentalen Repräsentationen bestimmt. 
Dieser Abgleich führt auf der Basis vergangener Erfahrungen zu Hypo- 
thesen, die sich entweder bestätigen oder im Licht neuer Informationen 
modifiziert werden müssen. 


Unwillkürliche Aufmerksamkeit 


Neben der willkürlichen Aufmerksamkeitssteuerung, die unter dem 
Begriff Top-down-Modus subsumiert wurde, werden in neueren Aufmerk- 
samkeitstheorien zunehmend auch unwillkürliche Aufmerksamkeitszu- 
wendungen berücksichtigt. Ich halte mich bei der folgenden Behandlung 
hauptsächlich an den Aufsatz von Eimer/Nattkemper/Schröger/Prinz 
(1996), welche diesen Mechanismus auf der Basis von akustischen Experi- 
menten darstellen. Vom Top-down-Prozess wird die unwillkürliche Auf- 
merksamkeit unter dem Begriff Bottom-up-Modus unterschieden. Dieser 
Begriff geht von der Vorstellung aus, dass unwillkürliche Aufmerksamkeit 
von äußeren, peripheren Ereignissen ausgelöst wird. 

Den Begriff der unwillkürlichen Aufmerksamkeit beziehen Eimer 
et al. (1996: 220) ausschließlich auf den Mechanismus der Selektion und 
grenzen ihn damit vom Konzept der automatischen Informationsverarbei- 
tung ab, welches auch Prozesse berücksichtigt, die sich an die Selektion 
anschließen. Außerdem weisen sie darauf hin, dass auch die unwillkürli- 
che Aufmerksamkeit mit internen Voraussetzungen zusammenhängt und 
nicht ausschließlich auf der Basis von Reizeigenschaften erklärt werden 
kann. 

Weiter unterscheiden die Autoren zwischen spezifischer und unspe- 
zifischer Selektion. Unter spezifischer Selektion verstehen sie eine Attrak- 
tion, die von latenten Wünschen, Bedürfnissen oder Interessen mitaus- 
gelöst wird. Als Beispiel kann man sich eine hungrige Person vorstellen, 
welche selektiv auf Reize reagieren wird, die im Zusammenhang mit dem 
Hungergefühl stehen, den Anblick oder den Duft von appetitlichen Spei- 
sen. Die latente Disposition unterscheidet sich von der manifesten Dis- 
position dadurch, dass das Subjekt von keiner Intention geleitet, sondern 
erst durch den Reiz auf einen bereits bestehenden Zustand hingewiesen 
wird. 

Im Unterschied dazu wird die unspezifische Selektion nicht von 
bestimmten als absolute Werte zu spezifizierenden Merkmalen ausge- 
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lost, sondern von Merkmalen, die sich nur relational ausdrticken lassen. 
Da Relationen vor allem für die auditive Wahrnehmung von allgemeiner 
Bedeutung sind, wie mehrfach betont wurde, lassen sich diese Mechanis- 
men nicht nur sehr gut an Experimenten mit akustischen Reizen unter- 
suchen, sondern sie sind für den Gegenstand dieser Arbeit auch von gro- 
fer Relevanz. Reize, die eine unspezifische Selektion auslösen, zeichnen 
sich generell durch Merkmale aus, die vom Kontext abweichen. Das kann 
ein plötzliches lautes Geräusch sein oder auch ein falscher Ton in einem 
Musikstück. Beiden Beispielen ist gemeinsam, dass es sich um Abwei- 
chungen in der Zeit handelt. 

Eimer et al. konstatieren zwei Typen solcher Abweichungen: Pegel- 
sprünge und Regelbrüche. «Von Pegelsprüngen soll dann die Rede sein, 
wenn in einer aktuellen Reizsituation eine schlagartige Veränderung ein- 
tritt- z.B. dadurch, dass ein neuer Reiz erscheint, oder dadurch, dass sich 
ein Merkmal eines Reizes ändert und einen neuen Wert annimmt» (Eimer 
et al. 1996: 223). Ein Pegelsprung ist beispielsweise ein plötzliches lautes 
Geräusch. 

Einen Regelbruch muss man sich als Durchbrechung einer Ereignis- 
sequenz vorstellen, die durch eine implizite oder explizite Regularität 
gekennzeichnet ist. Bei einem falschen Ton in einer Musikdarbietung, 
der einen solchen Regelbruch veranschaulicht, werden die Regeln durch 
die vorausgehende Organisation des musikalischen Materials bestimmt. 
Ein anderes Beispiel kann ein sich ändernder Rhythmus sein. Eimer et al. 
zitieren einen tropfenden Wasserhahn, der plötzlich versiegt. Der Sound 
Designer Richard Beggs (in Pasquariello 1996: 144) schildert einen solchen 
Regelbruch aus TUCKER — THE MAN AND His DREAM (USA 1988, Francis 
Ford Coppola). Dort konzentrierte er die Aufmerksamkeit während eines 
psychotischen Ausbruchs des Protagonisten, indem er im Hintergrund 
das Geräusch eines Kompressors mehrfach abrupt veränderte und es am 
Schluss ganz stoppte. Während im Fall des Pegelsprungs die Veränderung 
nur einfache sensorische Dimensionen erfasst, beziehen sich Regelbrüche 
auch auf komplexere sequenzielle Strukturen. 

Ein zentrales Konzept für das Verständnis der unwillkürlichen Auf- 
merksamkeit ist die Orientierungsreaktion (OR), unter welcher man ver- 
schiedene physiologische Reaktionen - unter anderem das Absinken des 
Hautwiderstandes oder Veränderungen der Puls- oder Atemfrequenz — 
versteht, die sich messen lassen, sowie Verhaltensreaktionen — wie die 
Kopfbewegung in Richtung der Schallquelle -, die der Beobachtung 
zugänglich sind. Intensitätsänderungen wie Pegelsprünge lösen typi- 
scherweise eine Orientierungsreaktion aus, und zwar sowohl sogenannte 
Onsets (wie der laute Knall) als auch Offsets (wie plötzliche Stille). Eine 
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Orientierungsreaktion bei Regelbriichen setzt voraus, dass die Eigenschaf- 
ten der Regelmäßigkeit vom Organismus extrahiert werden. 

Im Unterschied zu willkürlichen Prozessen wird die Orientierungs- 
reaktion nicht durch die Bedeutsamkeit des Reizes, sondern lediglich 
durch eine Veränderung ausgelöst. Dabei handelt es sich entweder um eine 
Intensitätsveränderung (laut versus leise) oder um qualitative Aspekte 
wie die Veränderung der Klangfarbe oder der Tonhöhe. 

Die Reaktion korreliert mit dem Nettobetrag der Veränderung. «Je 
größer die mit dem Erscheinen eines Stimulus einhergehende Verände- 
rung, desto ausgeprägter dessen Fähigkeit, unwillkürliche Aufmerksam- 
keit auf sich zu ziehen» (Eimer et al. 1996: 234). Weiter ist von Bedeutung, 
dass eine solche unwillkürliche Orientierungsreaktion auch gegen die 
Intention der Probanden stattfindet, die sensorische also die semantische 
Dimension dominieren kann. Oder, anders ausgedrückt, sind physische 
Merkmale bessere Selektionskriterien als semantische (Neumann 1996: 
607). Als semantisch motivierter Auslöser einer Orientierungsreaktion ist 
zum Beispiel der Eigenname zu nennen, auf den man hochgradig sensibi- 
lisiert ist; auch die subjektive Bewertung eines Geräuschs kommt infrage: 
zum Beispiel ein menschlicher Schreioder das Geräusch des Erbrechens 
(Schick 1980). 

Bei wiederholter gleichartiger Reizung und bei Fortdauern eines 
neuen Reizes findet eine Gewöhnung statt, die man Habituation nennt. 
Deshalb vergessen wir Störgeräusche wie technische Deformationen, 
wenn sie kontinuierlich vorhanden und relativ konstant sind. Wir kön- 
nen zum Beispiel eine alte Schallplattenaufnahme mit Genuss anhören, 
obwohl sie rauscht und knistert, wenn uns die musikalische Interpretation 
fasziniert. Dieses Ausblenden nicht relevanter sensorischer Daten habe 
ich bereits im Zusammenhang mit der Abbildung (> 86) beschrieben; die 
Habituation ist auch die Grundlage der Transparenz des kinematografi- 
schen Apparats. Bei sehr hohen Lautstärken bleibt die Habituation aus. Es 
kommt stattdessen zu einer Daueraktivierung, die eine Verteidigungsre- 
aktion auslöst (Rudolph 1993: 35). 

Auf eine weitere Form der unwillkürlichen Aufmerksamkeit weist 
ten Hoopen (1996: 124) hin. Dieser Mechanismus lässt sich als komple- 
mentär zum Regelbruch erklären. Regeln, wie sie insbesondere durch zeit- 
liche Muster installiert werden, lenken die Aufmerksamkeit, indem sie die 
Antizipation befördern. Einmal etabliert, tendieren Hörer dazu, ihre Auf- 
merksamkeit auf die akzentuierten Zeitabschnitte zu lenken. Ten Hoopen 
nennt dieses Konzept eine zeitliche Voraktivierung; solche Voraktivierun- 
gen werden insbesondere dort wirksam, wo deutliche Muster dominieren, 
das heifst, in der Sprache und in der Musik. 
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Physikalisch gesehen, verliert ein Klangobjekt seine Identität, sobald meh- 
rere Klangobjekte gleichzeitig vorhanden sind. Die akustischen Eigen- 
schaften allein können deshalb die analytische Tätigkeit des auditiven 
Apparats nicht erklären, der ohne Weiteres in der Lage ist, einzelne Objekte 
aus einem Klanggemisch zu extrahieren. Wenn eine Kutsche bei Regen 
von einem Pferd über Kopfsteinpflaster gezogen wird, so können pro- 
blemlos dreiverschiedene Klangobjekte identifiziert werden: das rhythmi- 
sche Klacken der Hufe auf Stein, das Rumpeln der Kutsche und das breit- 
bandige, kontinuierliche Geräusch des Regens. Eine solche Leistung, die 
noch relativ einfach erscheint, kann von künstlichen Intelligenzen bisher 
nicht erbracht werden. Computer scheitern vor allem an der dynamischen 
Struktur der sich ständig wandelnden Erscheinungen, die eine flexible 
Anpassung der Wahrnehmungs- und Informationsverarbeitungssysteme 
erfordern (Jaeger 1994). 

Für die Aufspaltung komplexer akustischer Reizmuster hat sich auch 
im deutschen Sprachraum der Terminus Streaming (ten Hoopen 1996: 138) 
etabliert. Unter Strömen kann man sich dabei Ereignisketten vorstellen, die 
aus einzelnen Klangobjekten bestehen. Ein besonders bestechendes Bei- 
spiel für die parallele Wahrnehmung verschiedener Ströme sind polyfone 
musikalische Werke.! 

Bei dieser auditiven Sinnsuche vereinigen sich Aspekte der Objekt- 
wahrnehmung mit Prozessen höherer Ordnung wie der Integration diver- 
ser Objekte in Chunks oder Ströme. Diese kognitiven Organisationspro- 
zesse werden maßgeblich durch Prozesse der Aufmerksamkeitssteuerung 
und der Selektion beeinflusst, wie sie im vorangehenden Abschnitt 
beschrieben wurden. 

Mehrere Publikationen (Terhardt 1987; Divenyi/Blauert 1987; Schafer 
1977) zitieren Ergebnisse der Gestaltpsychologie, um die Prozesse zu durch- 
leuchten, die bei der Wahrnehmung komplexer akustischer Strukturen 
ablaufen. Obwohl einige Pioniere der Gestaltpsychologie — Terhardt (1987: 
158) nennt Ehrenfels und Köhler — daran dachten, die musikalische Perzep- 
tion in ihre Überlegungen miteinzubeziehen, lag der Schwerpunkt ihrer For- 


1 Handel (1989) nennt diesen Prozess stream segregation, Bregman (1990, 1993) spricht 
von scene analysis. Beide Autoren, die sich besonders intensiv und reichhaltig mit die- 
sem Phänomen auseinandersetzen, meinen damit dasselbe, nämlich den Prozess des 
sensorischen und semantischen Aussortierens auf der Basis von mentalen Repräsenta- 
tionen und akustischen Indikatoren. Oder wie Handel (1989: 185) ganz einfach formu- 
liert: «Listening is making sense.» 
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schung doch im visuellen Bereich. Der Gestaltansatz kann fiir die Tonwahr- 
nehmung also nur interpretiert werden (vgl. auch Schaeffer 1966: 272 ff.). 


Die Gestaltpsychologie trat zunächst als eine Kritik der von ihr sogenannten 
«atomistischen» Psychologie auf, die, einseitig an den Naturwissenschaften 
orientiert, quantitativ-additive Erklärungen vor allem der Wahrnehmung 
versucht hatte. [Dieser Auffassung] setzte die Gestaltpsychologie die Über- 
zeugung entgegen, dass jeder Detailwahrnehmung die Wahrnehmung eines 
«Ganzen», die sogenannte «Gestaltwahrnehmung», vorangehe. 

(Winkler 1992: 128) 


Dieser Gedanke lässt die Gestaltpsychologie als besonders geeignet zur 
Erklärung der auditiven Wahrnehmung erscheinen, die immer in Relatio- 
nen, also ganzheitlich, funktioniert. 

Deshalb ist die Unterscheidung von Figur, Grund und Feld für die Psy- 
chologen der auditiven Wahrnehmung eine Selbstverständlichkeit gewor- 
den (vgl. Breitenbach 1989). Diese Unterscheidung, die ursprünglich aus 
der visuellen Wahrnehmung stammt, setzt für den Begriff Figur das Vor- 
handensein einer Kontur voraus, aufgrund derer sie sich vom Grund 
abhebt. Mit Feld wird der größere kulturelle Kontext, der Ort, an dem die 
Beobachtung stattfindet, bezeichnet. Eine Kontur ist in Bezug auf akusti- 
sche Ereignisse nicht ohne Weiteres evident und lässt sich nur anhand der 
mentalen Repräsentation von Klangobjekten erklären - sie setzt ein Wie- 
dererkennen voraus. Die Beziehung Figur — Grund ist nicht stabil. Sie kann 
umgekehrt werden. Schafer (1977: 133) nennt Muzak als Beispiel einer sol- 
chen Umkehrung: Musik nicht mehr als Figur, sondern Grund. 

Das Erkennen von Konturen geht mit einer impliziten Kategorisierung 
einher: Das heifst, die einzelnen Geräusche werden nicht bestehenden Kate- 
gorien zugeordnet, sondern miteinander verglichen und in hierarchischen 
Schichten verarbeitet (Terhardt 1987: 158). Einen solchen Vorgang nannte 
Broadbent (1971) Einsortieren (> 246). Dieses Vergleichen muss man sich als 
Entscheidungsprozess vorstellen, wie beispielsweise in der Frage: Ist A lauter 
als B? Dabei werden Kriterien wie Zeit (früher-später), Lautstärke (lauter—lei- 
ser), Frequenz (höher-tiefer) und Dauer (länger-kürzer) wirksam. Eigenschaf- 
ten wie Regelmäfßsigkeit, Symmetrie, Geschlossenheit, Einheitlichkeit, Ausgeglichen- 
heit, maximale Einfachheit und Knappheit werden bevorzugt (Winkler 1992: 129). 

Auf der Grundlage von Experimenten haben die Gestaltpsycholo- 
gen eine Reihe von Kriterien untersucht, nach denen sich Merkmale in 
der Wahrnehmung zu Gestalten formieren. Diese Kriterien werden von 
der Grafik (Abb. 45) veranschaulicht. Eine Problematik des Gestaltansat- 
zes liegt — wie Winkler (1992: 131) zu Recht einwendet - in seiner ontolo- 
gischen Präsupposition: in der Annahme, dass es so etwas wie klar abge- 
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grenzte, distinkte Objekte in der Welt gebe. Doch Objekte sind keinesfalls 
an sich distinkt; wir sind es, die sie unterscheiden. 

Mit Gewinn hat Meyer (1956) den Gestaltansatz aufgegriffen, um den 
Zusammenhang zwischen Strukturbildung und emotionaler Reaktion am 
Beispiel von musikalischen Kompositionen darzustellen. Auch Handel 
(1989: 186 f.) diskutiert zunächst einige Aspekte des Gestaltansatzes, die 
er dann zu einer mehr globalen Ausgangsbasis für seine Betrachtung der 
physikalischen Parameter umformt, welche die Gruppierung disperser 
Klangobjekte determinieren. 


Z. 


m 


e 


45 


Zeit 


Einer der wichtigsten Faktoren zum Aussortieren unterschiedlicher Klang- 
objekte ist die Zeit. Physikalische Komponenten, die zu ein und demselben 
Klangobjekt gehören, entwickeln sich synchron auf der Zeitachse. Experi- 
mentelle Studien haben ergeben, dass bereits eine Asynchronität von 20 
bis 30 ms ausreicht, um zwei Klangobjekte getrennt voneinander wahrzu- 
nehmen, selbst dann, wenn zwischen ihnen eine harmonische Beziehung 
besteht, die Frequenz des einen Klangobjekts also ein ganzzahliges Vielfa- 
ches des anderen ist. Der Zeitfaktor als Grundlage zur Trennung oder Bin- 
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dung unterschiedlicher Merkmale spielt bei der intermodalen Assoziation 
(> 139) eine entscheidende Rolle. Sie kann mit der Netzwerkarchitektur 
des Gehirns gut erklärt werden. Im Zeitcodierungsmodell schafft das syn- 
chrone Feuern von unterschiedlichen merkmalsensitiven Zellen die Basis 
für die Integration dieser Zellen in neuronale Netze. Die Synchronisa- 
tion festigt weiter die Objektwahrnehmung, indem auch Verschiebungen 
simultane Veränderungen auslösen, die als synchrone Feuerungsmuster 
die Zellverbände integrieren (vgl. Engel 1996: 200). 

Bregman hat zwei Gesetzmäßigkeiten formuliert, welche die physi- 
kalischen Grundlagen dieses Wahrnehmungsmechanismus beleuchten: 


Töne, die nicht in Beziehung zueinander stehen, beginnen oder enden selten 
im selben Augenblick. 

Viele Veränderungen eines akustischen Ereignisses werden alle Komponen- 
ten des resultierenden Tons in der gleichen Art und zur gleichen Zeit beein- 
flussen.? (Bregman 1993: 17) 


In der Terminologie des Gestaltansatzes wiirden diese Erscheinungen 
unter das Gesetz des gemeinsamen Schicksals fallen. Als Beispiel kann das 
Hubschraubergeräusch dienen, das aus verschiedenen Komponenten — 
dem Schlagen der Rotorblätter und verschiedenen Motorengeräuschen — 
besteht, mit dessen Kompositionalität ich mich unter dem Stichwort 
Verfremdung (> 289) nochmals beschäftigen werde. Die verschiedenen 
Komponenten werden unter anderem deshalb einem gemeinsamen Objekt 
zugeschrieben, weil sie sich gemeinsam entwickeln. Ihre Integration wird 
weiter unterstützt durch die identische räumliche Platzierung, sodass eine 
Codierung auf mehreren Ebenen zusammenspielt. 


Tempo 


Als weiterer zeitlicher Faktor beeinflusst das Tempo die perzeptive Grup- 
pierung. Bei geringem Tempo - Handel (1989: 194) nennt zwei Elemente 
pro Sekunde - können auch Klangobjekte mit deutlicher Frequenztren- 
nung in einen Strom integriert werden. Mit zunehmender Geschwin- 
digkeit beginnt die Frequenztrennung zu dominieren, das heißt, hohe, 
mittlere oder tiefe Klangobjekte formieren einzelne getrennte Ströme. 
Bereits im Barock haben Komponisten mit monofonen Instrumenten, bei- 
spielsweise mit der Blockflöte, virtuell mehrstimmige Werke geschaffen. 
Sie haben den psychophysischen Mechanismus des Streaming intuitiv 


2 «Unrelated sounds seldom start or stop exactly at the same time. Many changes that 
take place in an acoustic event will affect all the components of the resulting sound in 
the same way and at the same time.» 


Die kognitive Organisation komplexer Klangmuster: Streaming 257 


2 Elemente pro Sekunde 


u u; 1 


5 Elemente pro Sekunde 


Frequenz 


10 Elemente pro Sekunde 


46 Zeit (s) 


genutzt, indem sie Töne mit deutlich getrennter Tonhöhe in schneller 
Folge alternierend präsentierten. 

Auch dieses Gruppierungsgesetz kann mit dem Gestaltansatz als 
Gesetz der Nähe erklärt werden. Subjektiv schafft das größere Tempo eine 
Kohärenz durch Nähe, indem die Parameter Frequenz und Tempo zuein- 
ander in Beziehung stehen, wobei das System den einen Parameter gegen 
den anderen verrechnet. Bei Geräuschen kommen als weitere Determinan- 
ten die Komponenten Klangfarbe und Hüllkurve hinzu. 

Ten Hoopen (1996: 138) zitiert eine Untersuchung, in der den Pro- 
banden eine Schleife mit vier Geräuschen - einem Zischlaut, einem Sinus- 
ton, einem Summen und dem Phonem [i:] — zugespielt wurde. Bei hoher 
Geschwindigkeit fassten die Probanden die einzelnen Geräusche zu Strö- 
men zusammen, bei geringem Darbietungstempo lösten sich die Ströme in 
die einzelnen Klangobjekte auf (Abb. 46). 
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Frequenz 


Neben den Faktoren Zeit und Tempo ist die Frequenz eines der wichtigen 
Merkmale zur Einteilung diverser Klangobjekte zu Strömen. Wie immer, 
wenn es um die Beschäftigung mit der perzeptiven Verarbeitung von 
akustischen Ereignissen geht, kann jedoch auch die Frequenz nicht isoliert 
betrachtet werden. Sie korrespondiert mit den Komponenten Zeit, Tempo, 
Intensität, Klangfarbe und räumliche Position. Wenn sich beispielsweise zwei 
Klangobjekte mit gleicher Frequenz in der Intensität um mehr als 25% 
unterscheiden, wirkt sich der Intensitätsunterschied bereits als Streaming 
aus. Ein solcher frequenzbedingter Strom ist zum Beispiel in der beschrie- 
benen Kampfszene (> 211) aus RUMBLE FısH (USA 1983, Francis Ford 
Coppola) zu beobachten, in welcher verschiedene basslastige Klangob- 
jekte einander ablösen. Bei komplexen Klangobjekten wird die Wahrneh- 
mung der Tonhöhe von spezifischen Frequenzbündeln definiert, die in 
Anlehnung an Schafer (1977) als Masse bezeichnet wurden (— 207). Unter 
diesen Umständen wäre es beispielsweise denkbar, dass eine Teilkompo- 
nente eines komplexen Klangobjekts sich mit einem anderen Klangobjekt 
zu einem Strom formiert, beispielsweise das Knistern eines Feuers mit 
einem Grillenzirpen. 

Die wahrgenommene Tonhöhe ist jedoch nicht nur eine Funktion 
der Frequenzbündel, sondern auch der Hüllkurve und der Klangfarbe. 
Diese Komponenten können die Gruppierung insbesondere von Geräu- 
schen stärker beeinflussen als die Tonhöhe. Die Wahrnehmung verschie- 
dener Geräusche wird stärker von der morphologischen Integration von 
Hüllkurve und Klangfarbe beeinflusst als von der Tonhöhe. Eine solche 
Verschiebung der Streaming-Faktorentritt speziell bei Geräuschen mit 
wenig ausgeprägter Tonhöhenentwicklung in den Vordergrund. Als Bei- 
spiel können verschiedene Formen des Summens genannt werden, die zu 
einem Strom verschmelzen. 


Kontinuität 


Wenn sich die Faktoren langsam ändern, können Klangobjekte ineinan- 
der übergehen. Dieses Prinzip verhält sich komplementär zur Wirkung 
von Pegelsprüngen. Während Pegelsprünge etwas Neues indizieren und 
damit an sich Aufmerksamkeit heischend wirken, bieten langsame Ent- 
wicklungen dem Wahrnehmungsapparat die Chance, solche Veränderun- 
gen als Entwicklungen ein und desselben Objekts zu verstehen. Besonders 
einleuchtend lässt sich dieser Mechanismus am Beispiel Dopplereffekt 
darstellen. Wenn sich schnell bewegte Objekte — Autos oder Flugzeuge — 
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nähern und wieder entfernen, entsteht eine langsame Tonhöhenentwick- 
lung, die ohne Weiteres einer einzigen Quelle zugeordnet werden kann. 
Dieser Wahrnehmungsmechanismus gründet auf der lebenslangen Erfah- 
rung mit der zeitlichen Dimension von klanglichen Veränderungen in der 
Umwelt. 

Bregman beschreibt die physikalischen Grundlagen dieser Wahrneh- 
mung folgendermaßen: 


(a) Ein einzelner Ton tendiert dazu, seine Eigenschaften sanft und langsam 
zu ändern. 

(b) Auch eine Folge von Tönen, die von derselben Quelle stammen, ändert 
ihre Eigenschaften langsam.’ (Bregman 1993: 17) 


Räumliche Trennung 


Weiter wird die Spaltung komplexer Schichtungen durch die räumliche 
Trennung der Schallquellen maßgeblich beeinflusst. Wie Cherry (1953) 
aufgezeigt hat, verschmelzen verschiedene Ströme sofort, wenn die räum- 
lichen Parameter den Hörern in einer Monoaufzeichnung vorenthalten 
werden. Ein Winkelabstand von mehr als 10° genügt, um zwei Klangob- 
jekte voneinander zu unterscheiden. Selbst komplexe Schichtungen von 
mehreren Komponenten verschmelzen zu einem Klangobjekt, wenn sie 
derselben räumlichen Position zugeschrieben werden. Auf der anderen 
Seite verstärkt die Kombination von räumlicher Trennung und Frequenz- 
trennung den Streamingeffekt. Darum sind in Stereo wesentlich komple- 
xere Schichtungen möglich als in Mono (> 53). 


Intensität 


Intensität als Grundlage des Streaming wird dort dominant, wo klare Ion- 
höhen fehlen, das heißt, bei der Kategorie von Geräuschen, die über keine 
harmonische Struktur verfügen. Intensität wird jedoch zum verstärken- 
den und ausschlaggebenden Faktor, wenn die Klangobjekte sich hinsicht- 
lich anderer Merkmale voneinander unterscheiden. Als additive Merk- 
male kommen sämtliche bisher genannten Aspekte infrage. Wenn sich die 
Klangobjekte lediglich in ihrer Intensität unterscheiden, alle anderen Para- 
meter jedoch stabil bleiben, wird eine Trennung laut Handel (1989: 199) 
erst ab 25 bis 50 % Intensitätsunterschied wahrnehmbar. Bregman (1990: 


3 <(a)A single sound tends to change its properties smoothly and slowly. 
(b) A sequence of sounds from the same source tends to change its properties slowly.» 
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648) stellt einen Streaming-Effekt aufgrund von Intensitätsunterschieden 
generell infrage. Er postuliert, dass Intensitätsdifferenzen immer mit ande- 
ren Faktoren kombiniert werden müssen, um eine perzeptive Trennung zu 
verursachen. Auf den Monolichttonspuren wurden die Intensitätsunter- 
schiede zwischen Vorder- und Hintergrund deshalb überbetont, weil die 
Intensität nur bedingt zur Aufspaltung in perzeptive Ströme beiträgt. 


Kategoriale Kohärenz 


Als weitere Größe, welche die Formierung von Gruppen unterstützt, ist 
der semantische Aspekt zu nennen. Bezogen auf die Musikwahrnehmung 
bedeutet dies, dass sich beispielsweise Streicher oder Bläser in der Wahr- 
nehmung zu Strömen integrieren. Diese Integration wird auch befördert 
durch Ähnlichkeiten der Klangfarbe. Bei natürlichen Geräuschen kom- 
men weitere kategoriale Faktorenins Spiel; Schritte beispielsweise formie- 
ren sich auch dann zu Strömen, wenn sich ihre Klangfarbe, bedingt durch 
den Wechsel des Untergrunds, verändert. Die perzeptive Einheit dieses 
Klangobjekts wird unterstützt durch eine kontinuierliche räumliche Verla- 
gerung sowie in den meisten Fällen durch die Konvergenz von Rhythmus 
und Tempo. 

Kategoriale Kohärenz kommt auch dann zum Tragen, wenn sich 
sehr unterschiedliche Schichten überlagern. Das Geräusch eines Feuers 
beispielsweise, das ich unter dem Aspekt der Klangfarbe (> 205) näher 
dargestellt habe, besteht aus zwei bis drei Schichten, die auf der Zeitachse 
nur lose miteinander korrespondieren. Hier ist es vielmehr die wieder- 
kehrende Erfahrung eines Zusammenhangs vor wechselndem Horizont, 
welche die einzelnen Komponenten zu einem Strom zusammenschweißt, 
die dem visuellen Perzept Feuer zugeschrieben werden. Die semantische 
Kohärenz wird außerdem unterstützt durch die gemeinsame räumliche 
Positionierung der verschiedenen Komponenten. 

Besonders Handel (1989: 212f.) betont den Einfluss des Kontexts auf 
die semantisch motivierte Integration von Strömen. Der Kontext als sta- 
bilisierendes Element kommt dann zum Tragen, wenn einzelne Passagen 
durch andere Elemente maskiert werden. Die fehlenden Teile werden vom 
Gehirn induziert. Das heißt, wenn der Strom nach einem lauten Ereignis 
kontinuierlich erscheint, werden die unhörbaren Teileselbst dann wahrge- 
nommen, wenn sie in Wirklichkeit aus der Aufnahme herausgeschnitten 
wurden. 
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Rhythmische Muster 


Obwohl Rhythmus eines der selbstverstandlichsten Phanomene der All- 
tagswahrnehmung darstellt, fehlen bis heute theoretisch fundierte Publi- 
kationen dazu. De la Motte-Haber (1968) gelangt in ihren Reflexionen 
über eine mögliche Definition des Rhythmus zum Schluss, dass der Begriff 
sogar in der Eingrenzung auf das musikalische Phänomen so umfassend 
verwendet wird, dass allenfalls gewisse Kennzeichen wie Periodizität, zah- 
lenmäßige Proportion oder Tendenz zur Gruppenbildung ausgemacht werden 
können. Metrum ist die Organisation von akzentuierten und unbetonten 
Schlägen, welche die Musik und viele Sprachen strukturiert. Das Metrum 
ist jenes stabile zeitliche Gerüst musikalischer Kompositionen, das die 
meisten Menschen intuitiv als Rhythmus bezeichnen würden. 

Rhythmen segmentieren die Zeit durch die Wiederkehr des Gleichen 
oder Ähnlichen. Der Herzschlag ist ein Rhythmus, der Wechsel von Tag 
und Nacht, die Jahreszeiten. Neuere psychoakustische Publikationen ver- 
meiden den Terminus häufig und verwenden stattdessen den Begriff zeit- 
liches Muster (temporal pattern), was im Kontext Filmton von Vorteil ist, 
denn Geräusche lassen sich selten in Funktion eines musikalischen Met- 
rums analysieren. 

Die subjektive, intrapsychische Organisation bestimmt die Mus- 
terwahrnehmung, wobei weitgehend erworbene Mechanismen für die 
Strukturierung verantwortlich sind. Der zyklische Charakter, der aus 
der Periodizität resultiert, verunmöglicht eine Einteilung in Anfang und 
Ende nach logischen Gesichtspunkten. Die Folge 0XX0XX könnte logisch 
auf drei Arten organisiert werden, als 0XX, X0X oder XX0. Dennoch wäre 
die Wahrnehmung von X0X sehr unwahrscheinlich. Robin /Royer/ Abbas 
(1987: 88 f.) haben unter anderem folgende Gesetzmäßigkeiten entdeckt, 
die sie run- und gap-Prinzipien nennen: Das run-Prinzip besagt, dass das 
erste Element einer längeren Folge als Anfang eines Musters erkannt wird, 
während das gap-Prinzip auf der Wahrnehmung einer Pause zwischen den 
einzelnen Perioden beruht. Eine dritte Möglichkeit ist die Strukturierung 
von Mustern durch Akzente, einzelne Töne, die sich durch Lautstärke, 
Daueroder Klangfarbe von der Umgebung unterscheiden. Alle Parame- 
ter von Klangobjekten spielen bei der Organisation von akustischen Mus- 
tern zusammen, keiner kann isoliert betrachtet werden. Meyer (1956: 103) 
nennt weiter die Melodieführung, die harmonische Entwicklung, die Ins- 
trumentierung und Artikulation als Komponenten. Mithin ist Rhythmus 
ebenso wie die Stille ein relationales System, das durch den näheren und 
weiteren Kontext geprägt ist. Im Gegensatz zur weitverbreiteten Auffas- 
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sung, dass die Akzentuierung von einzelnen akustischen Ereignissen pri- 
mär der physikalischen Beschaffenheit der Klangobjekte - insbesondere 
der dynamischen Betonung - zugeschrieben werden muss, belegt Meyer 
(1956: 104) an einer Reihe von Beispielen, dass die Organisation in einem 
weiteren Umfeld stärker über die Wahrnehmung einer rhythmischen 
Struktur entscheidet. 

Handel (1989: 391) postuliert, dass rhythmische Strukturen hierar- 
chisch organisiert sind. Einzelne Gruppen mit kleineren Einheiten und 
höherem Tempo werden in übergeordnete Strukturen mit langsameren 
Tempi integriert. Diese Gruppierungsstrategie kann als Chunking (> 307) 
aufgefasst werden. In der Sprache sind das beispielsweise Teilsätze, in der 
Musik sogenannte Phrasen, das heißt, melodisch-rhythmische Einheiten. 
Neben dem Chunking als Komplexitätsreduktion werden Rhythmen in 
der Wahrnehmung weiter vereinfacht, indem ähnliche Zeitabstände als 
gleich aufgefasst werden, während die längeren Segmente als ganzzahli- 
ges Vielfaches der kurzen Zeitintervalle wiedergegeben werden (Handel 
1989: 402). 

Man nimmt Muster nur innerhalb gewisser zeitlicher Grenzen wahr. 
Bei extrem langsamer Darbietung sind keine Muster mehr zu entdecken, 
bei extrem kurzen Zeitdifferenzen lösen sie sich in Textur oder Klangfarbe 
auf. Das Beispiel Besteckklappern kann diese Beobachtung verdeutlichen. 
Ist nur ab und an ein einzelnes Klappern zu hören, so entwickelt es keine 
rhythmische Struktur, wenn hingegen mehrere Leute gleichzeitig hantie- 
ren, entstehen amorphe Rhythmen, und in einem Restaurant verschmel- 
zen die einzelnen Hantierungsgeräusche zu einem dichten Teppich, der 
als eine Art Klangfarbe empfunden wird. 

Bei den Betrachtungen zur Basswahrnehmung (> 209) habe ich eine 
andere wichtige Grundlage der Rhythmuswahrnehmung angesprochen: 
die direkte Nachbarschaft der Cochlea zum vestibulären System. Tomatis 
(1981) betont die Wechselwirkung von Bewegungsmeldung, Schallemp- 
findung und Bewegungsmotivation. Das Gleichgewichtsorgan registriert 
die tiefen Frequenzen des Schalls als rhythmisches Phänomen. Jeder Mus- 
kel steht über das Rückenmark mit dem Nerv des Gleichgewichtsorgans 
in Verbindung, der sich mit dem Nerv des Hörorgans zum Nervus vesti- 
bulo-cochlearis vereint. Muskeltonus, Haltung, Motorik und Feinmotorik 
werden durch das Ohr als Kontrollorgan reguliert. Man spricht von einem 
kybernetischen Regelkreis (Manassi in Tomatis 1981: 19f.). 

Handel (1989: 383 f.) unterscheidet vier Formen der Reaktion auf 
Rhythmus: eine mehr analytische auf die physikalischen Gegebenheiten 
des Rhythmus, eine emotionale auf die Parameter zwischen den Extrem- 
polen erregend-beruhigend, eine Verhaltensreaktion wie Fingerschnip- 
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pen, Klatschen oder Tanzen und eine physiologische Reaktion des vege- 
tativen Systems, das unwillkürlich die Atem- und Herzfrequenz, den 
Muskeltonus, die neuronale Ubertragung und die elektrische Aktivität im 
Gehirn an einen gegebenen Rhythmus anpasst. Rudolph (1993: 79) zitiert 
eine Untersuchung an Säuglingen, welche als beruhigende Bezugsfre- 
quenz die Urerfahrung des mütterlichen Herzschlags mit durchschnittlich 
72 Schlägen pro Minute festlegt. Höhere Tempi führen zu einer zunehmen- 
den Aktivierung. In der Techno-Musik sind Tempi um die 200 Schläge pro 
Minute (beats per minute, bpm) üblich. Die unausweichliche Dominanz, mit 
welcher ein Rhythmus sich auf die Reaktionen auswirkt, wird außerdem 
stärker von der Lautstärke als von der Beschaffenheit des rhythmischen 
Musters geprägt. 

Im Gegensatz zu Techno und anderen Formen von stark rhythmi- 
sierter Musik ist Rhythmus im Kino meistens nur ein Teil der auditiven 
Erfahrung und darum nur in Maßen direkt und ausschließlich für die 
Reaktionen zuständig. Motorische Reaktionen erfordern jedoch eine klare 
metrische Struktur mit einer deutlich wahrnehmbaren Periodizität (Meyer 
1956: 116). Diese Anforderung ist im Kino selten gegeben. Der mimeti- 
sche Aspekt der Tonspur, der auf die Konstruktion natürlich wirkender 
Lautsphären ausgerichtet ist, verbietet nachgerade eine allzu offensicht- 
lich regelmäßige Strukturbildung. Exakte akustische Regelmäßigkeit ist 
immer ein Hinweis auf einen menschlichen Eingriff, der sich beispiels- 
weise in mechanischen oder elektronischen Abläufen findet, in Uhren oder 
Maschinen. Natürliche Klangereignisse wie Meeresbrandung variieren 
hingegen immer leicht, selbst wenn sie gleichförmig erscheinen. Sämtliche 
Sound Designer, mit denen ich gesprochen habe, achten sorgfältig dar- 
auf, strukturelle Gestaltungsprinzipien nur dann an die Oberfläche treten 
zu lassen, wenn damit eine Aussage verbunden ist. In allen anderen Fäl- 
len — das dürfte die Mehrzahl sein — mischen sie Regelmäßiges immer mit 
Zufälligem, um den Aspekt des Gemachten zu verbergen. 

Akustische Muster in Verbindung mit Faktoren wie Erzählrhythmus 
und Schnittfrequenz spielen eine wichtige Rolle bei der Aufmerksamkeits- 
steuerung und Strukturbildung, indem sie die aktive Antizipation und die 
semantische Gliederung unterstützen. 


9 Musikalisierung der Tonspur 


Uber die Rockmusik fand ab den späten 1950er-Jahren eine Tendenz zu 
den Massen, die sich seit der Jahrhundertwende in den intellektuellen Zir- 
keln der musikalischen Avantgarde entwickelt hatte: die Auflösung fes- 
ter Grenzen zwischen Musik und Geräusch. Hundert Jahre früher, in den 
1860er-Jahren, war es für den Psychophysiker Helmholtz (1862: 14) klar, 
dass ein musikalischer Klang dem Ohr als vollkommen «ruhig, gleichmä- 
fig und unveränderlich» erscheine, während die Geräusche der Umwelt 
«unregelmäßig gemischt und durcheinandergeworfen» seien. Helmholtz 
hielt es für möglich, musikalische Klänge in Geräusche zu überführen, 
aber nicht umgekehrt. 


In der That kann man Geräusche aus musikalischen Klängen zusammen- 
setzen, wenn man z.B. sämmtliche Tasten eines Claviers innerhalb der Breite 
von einer oder zwei Octaven gleichzeitig anschlägt. Hiernach ist es klar, dass 
die musikalischen Klänge die einfacheren und regelmäßigeren Elemente der 
Gehörempfindung sind [...]. (Helmholtz 1862: 14) 


Die später einsetzende Transgression der Grenzen zwischen Musik und 
Geräusch war seit Beginn mit den Methoden der Klangaufnahme einer- 
seits und der elektrischen Produktion und Manipulation von Klängen 
andererseits verbunden. Ferruccio Busonis 1907 erschienener Entwurf einer 
neuen Ästhetik der Tonkunst, in welchem er die traditionelle Aufteilung der 
Tonskala in Halbton- und Ganztonschritte infrage stellte, bezog sich expli- 
zit auf die Möglichkeiten des ersten elektrischen Instruments, des Dyna- 
mophons Dr. Cahills (Busoni 1907: 44). 

Kompositorisches Schaffen mit Geräuschen wurde erstmals von 
den italienischen Futuristen — einer Gruppe von Malern, Dichtern und 
Musikern - zu Beginn des 20. Jahrhunderts propagiert.' Die kampflus- 
tigen Futuristen wandten sich gegen die «Wolkenbrüche, Pfützen» und 


1 Deutsch sind die Texte in folgenden Sammlungen enthalten: 
Schmidt-Bergmann, Hansgeorg (1993): Futurismus. Geschichte, Ästhetik, Dokumente. 
Reinbek/Hamburg: Rowohlt. 
Umbro Apollonio (1972): Der Futurismus. Manifeste und Dokumente einer künstlerischen 
Revolution 1909-1918. Köln: DuMont Schauberg. 
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«Sümpfe mystischer Tränen» in den aufgeblasenen Werken des Romanti- 
zismus. 


[Jetzt] verspüren [wir] einen weit größeren Genuss, wenn wir im Geist die 
Geräusche der Strassenbahn, des Explosionsmotors, der Wagen und der 
lärmenden Menge kombinieren als zum Beispiel beim nochmaligen Anhören 
der Eroica oder der Pastorale. 

Wir können den enormen Aufwand, den ein modernes Orchester darstellt, 
nicht sehen, ohne zugleich zu tiefst von seinen dürftigen akustischen Ergeb- 
nissen enttäuscht zu sein. [...] Wir wollen jetzt als Futuristen eines dieser 
Krankenhäuser für blutarme Töne betreten. [Man] braut ein widerwärtiges 
Gemisch aus der Monotonie der Empfindungen und der dummen religiösen 
Ergriffenheit der Zuhörer, die in buddhistischer Berauschtheit zum -zigsten 
Male ihre mehr oder weniger snobistische und einstudierte Ekstase wieder- 
holen.? (Russolo 1913: 131) 


F.T. Marinetti besang bereits im ersten futuristischen Manifest (1909) «das 
dröhnende Geräusch der großen zweistöckigen Straßenbahnen, das Kna- 
cken der Knochen der sterbenden Paläste und das Aufbrülllen hungriger 
Autos». 


Und wir jagten dahin und zerquetschten auf den Hausschwellen die Wach- 
hunde, die sich unter unseren heiß gelaufenen Reifen wie Hemdkragen unter 
dem Bügeleisen bogen. Der zahm gewordene Tod überholte mich an jeder 
Kurve und reichte mir artig seine Tatze; manchmal streckte er sich auch auf 
der Erde mit einem Geräusch knirschender Zähne aus und warf mir aus jeder 
Pfütze samtweiche, liebevolle Blicke zu. (Marinetti 1909: 3) 


Der rebellische Impetus der futuristischen Ideen ging einher mit der 
Verherrlichung der Aggression und des Krieges als einziger Hygiene der 
Welt, wie Marinetti schrieb. Diese Texte, welche die Pfützen-, Maschi- 
nen- und Eisenästhetik besingen, lesen sich wie die Anweisung zur 


2 


«[...] godiamo molto più nel combinare idealmente i rumori di tram, di motori a scop- 
pio, di carrozze e di folle vocianti, che nel riudire, per esempio, l’«Eroica> o la <Pasto- 
rale. 

Noi possiamo vedere quell’enorme apparato di forze senza provare la più profonda 
delusione davanti ai suoi meschini risultati acustici. [...] Entriamo insieme, da futuristi, 
in uno di questi ospedali anemici. [...] si opera una miscela ripugnante formata dalla 
monotonia delle sensazioni e dalla cretinesca commozione religiosa degli ascoltatori 
buddisticamente ebbri di ripetere per la millesima volta la loro estasi più o meno sno- 
bistica ed imparata.» 

«E noi correvamo schiacciando su soglie delle case i cani da guardia che si arrotonda- 
vano, sotto i nostri pneumatici scottanti, come solini sotto il ferro per stirare. La Morte, 
addomesticata, mi sorpassava ad ogni svolto, per porgermi la zampa con grazia, e a 
quando a quando si stendeva a terra con un rumore di mascelle stridenti, mandan- 
domi, da ogni pozzanghera, sguardi vellutati e carezzevoli.» 


266 Musikalisierung der Tonspur 


Gestaltung einer martialischen Tonspur. Mit einer Mischung aus Fas- 
zination und Abscheu entdeckt die Forscherin in den Gedanken Rus- 
solos und Marinettis dieselbe Asthetisierung des Hässlichen, Lauten, 
Rohen wie in der elektroakustisch verzerrten Rockmusik der 1960er- 
und 1970er-Jahre oder dem metallisch geprägten Universum zeit- 
genössischer Science-Fiction-Filme, beispielsweise Camerons Werke 
ALIENS — THE RETURN (USA 1986) und TERMINATOR 2 (USA 1991). Der 
faschistisch angehauchte ideologische Hintergrund Marinettis ist dem 
pazifistischen Tenor der Jugendkultur in den 1960er-Jahren zwar dia- 
metral entgegengesetzt; gemeinsam ist beiden Bewegungen jedoch eine 
fundamental antibürgerliche Haltung, welche die Provokation zum 
Programm erhebt. Diese Provokation findet ihren adäquaten Ausdruck 
im überdimensionierten Reiz, welcher die Bürger aus ihrem Schlaf rei- 
ßen soll. 


Wir erklären, dass sich die Herrlichkeit der Welt um eine neue Schönheit 
bereichert hat: die Schönheit der Geschwindigkeit. Ein Rennwagen, dessen 
Karosserie große Rohre schmücken, die Schlangen mit explosivem Atem 
gleichen ... ein aufheulendes Auto, das auf Kartätschen zu laufen scheint, ist 
schöner als die Nike von Samothrake.* (Marinetti 1909: 4) 


Bis in die Details der Ikonografie, der Funken sprühenden Schlange, wel- 
che die frisierten Motorräder der Rocker zierte, oder der donnernden Jets, 
welche seit den 1970er-Jahren durch die kinematografischen Galaxien 
brausen, schildert Marinetti die Begeisterung für die sensorische Dimen- 
sion der Geschwindigkeit. 

Russolos Texte klingen vergleichsweise zahm. In L’arte dei rumori 
(1913; 1916) stellt er einen Zusammenhang her zwischen dem Anwachsen 
der urbanen, industriellen Klangwelt und der Notwendigkeit, das tonale 
System der traditionellen Musik zu erweitern. Russolo (1913: 130) erkennt 
in den musikalischen Entwicklungen der Vergangenheit zunächst ein Stre- 
ben nach Reinheit und Vollkommenheit. Erst um die Jahrhundertwende 
wird die Musik mit komplexeren, dissonanteren Klangkombinationen 
durchwoben, die dem Ohr fremdartig und rau erscheinen und zuneh- 
mend geräuschhafte Elemente enthalten. 


Nicht nur in der lärmenden Atmosphäre der Großstädte, auch auf dem 
Lande, das bis gestern normalerweise still war, hat die Maschine heute eine 


4 «Noi affermiamo che la magnificenza del mondo si è arricchita di una bellezza nuova: 
la bellezza del la velocita. Un’automobile da corsa col suo cofano adorno di grossi tubi 
simili a serpenti dall’alito esplosivo ... un’automobile ruggente, che sembra correre 
sulla mitraglia, & piü bella della Vittoria di Samotracia.» 
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Vielzahl und ein Miteinander von Geräuschen erzeugt, sodass der reine Ton 
in seiner Spärlichkeit keine Emotionen mehr hervorruft. 

[...] 

Wenn wir eine Großstadt mit aufmerksameren Ohren als Augen durchqueren, 
dann werden wir das Gliick haben, den Sog des Wassers, der Luft oder des Gases 
in den Metallröhren, das Brummen der Motoren, die zweifellos wie Tiere atmen 
und beben, das Klopfen der Ventile, das Auf und Ab der Kolben, das Kreischen 
der Sägewerke, die Sprünge der Straßenbahn auf den Schienen, das Knallen der 
Peitschen und das Rauschen von Vorhängen und Fahnen zu unterscheiden. Wir 
haben Spaß daran, den Krach der Jalousien der Geschäfte, der zugeworfenen 
Türen, den Lärm und das Scharren der Menge, die verschiedenen Geräusche 
der Bahnhöfe, der Spinnereien und der Druckereien, der Elektrizitätswerke und 
der Untergrundbahnen im Geiste zu orchestrieren. (Russolo 1913: 130f.) 


Der Mensch des 18. Jahrhunderts — so Russolo — hätte die Dissonanzen der 
großen zeitgenössischen Städte nicht ertragen. Schafer konstatiert einen 
solchen Zusammenhang zwischen industrieller Lautsphäre und dem 
musikalischen Ausdruck schon in den Kompositionen Wagners und Ber- 
lioz’, deren Orchester eigens erweitert wurden, um mit ihrer imposanten 
Formensprache das neue großstädtische Publikum mitzureißen und zu 
begeistern (1977: 108). 

Russolo stellte die Geräusche künstlich her. Er entwickelte zusam- 
men mit dem Maler Ugo Piatti sogenannte Intonarumori, große mecha- 
nisch-akustische Klangerzeuger. Die Arbeit mit natürlichen Geräuschen 
scheiterte nicht nur an der damals unausgereiften Aufnahmetechnik; in 
Russolos Augen war es eine Notwendigkeit, das Geräusch aus dem refe- 
renziellen Bezug zur Wirklichkeit zu lösen, um es für die kompositorische 
Arbeit zu benutzen. 


Obwohl die Eigenart des Geräuschs darin besteht, uns brutal ins Leben zu 
versetzen, darf sich die Geräuschkunst nie auf eine imitative Wiederholung 


5 «Non soltanto nelle atmosfere fragorose delle grandi città, ma anche nelle campagne, 

che furono fino a ieri normalmente silenziose, la macchina ha oggi creato tante varieta 
e concorrenza di rumori, che il suono, nella sua esiguita e monotonia, non suscita pitt 
emozione. 
[...] Attraversiamo una grande capitale moderna, con le orecchie più attente che gli 
occhi, e godremo nel distinguere i risucchi d’acqua, d’aria o di gas nei tubi metallici, il 
borbottio di motori che fiatano e pulsano con una indiscutibile animalita, il palpitare 
delle valvole, l’andirivieni degli stantuffi, gli stridori delle seghe meccaniche, i balzi 
del tram sulle rotaie, lo schioccar delle fruste, il garrire delle tende e delle bandiere. Ci 
divertiremo ad orchestrare idealmente insieme il fragore delle saracinesche dei negozi, 
le porte sbatacchianti, il brusio e lo scalpiccio delle folle, i diversi frastuoni delle sta- 
zioni, delle ferriere, delle filande, delle tipografie, delle centrali elettriche e delle ferro- 
vie sotterranee.» 
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des Lebens beschränken. Sie wird ihre größte Emotionsfahigkeit aus dem 
akustischen Genuss selbst schöpfen, den die Inspiration des Künstlers aus 
den Geräuschkombinationen zu ziehen versteht.® (Russolo 1913: 133) 


Die Geräusche, mit denen Russolo arbeitete, waren unidentifizierbare 
Klangobjekte, die in dieser Arbeit als UKO bezeichnet werden: Brummen, 
Donnern, Pfeifen, Zischen, Surren, Brodeln, Knirschen, Knacken. Dazu 
kamen perkussive Geräusche, die durch das Schlagen auf diverse Materia- 
lien — Metall, Holz, Leder, Steine, Terrakotta — entstanden, sowie Tier- und 
Menschenstimmen: Rufe, Schreie, Stöhnen, Gebrüll, Geheul, Gelächter, 
Röcheln, Schluchzen. 

Die Geräusche, einmal aus der Referenzialität befreit, sollten auf- 
einander abgestimmt und harmonisch angeordnet werden, indem die 
vorherrschenden Klangaspekte miteinander korrespondierten, ohne ihre 
Unregelmäßigkeit und Wildheit einzubüßen (Russolo 1913: 132). 

Russolos Arbeit hat nur in Fragmenten überlebt. Es scheint zwei 
Aufnahmen davon zu geben: eine Originalaufnahme von 1921 und eine 
weitere, die 1977 von der Biennale di Venezia mit Rekonstruktionen nach 
Originalplänen der Intonarumori in Auftrag gegeben wurde; sie klingt vor 
dem Hintergrund der ausschweifenden und informativen theoretischen 
Überlegungen Russolos eher dürftig. Sicher ist, dass Russolo über eine 
bescheidene musikalische Ausbildung verfügte und sich kaum mit der 
zeitgenössischen avantgardistischen Musik von Strauss, Schönberg und 
Skrjabin auseinandersetzte (Lista 1975: 20), sondern sein Konzept autodi- 
daktisch und intuitiv entwarf. Nach den brutalen Erfahrungen des Ersten 
Weltkriegs zum Antifaschisten geworden, floh Russolo 1927 nach Paris, 
wo er seine Ideen in die französische Avantgarde einbrachte. Dort beglei- 
tete er gemäß Lista (1975: 26) mit dem Rumorharmonium, der integrierten 
Weiterentwicklung seiner Intonarumori, einen einzigen Film: LA MARCHE 
DES MACHINES (Frankreich 1928, Eugene Deslaw). 

Überlebt hat hingegen die Idee. Die Komponisten Arthur Honeg- 
ger, Igor Strawinsky und Edgard Varèse haben Konzerte Russolos gehört 
(Toop 1995: 92; Davies 1986: 156). Strawinsky hatte schon mit Le Sacre 
du Printemps (1913) die musikalischen Dimensionen von Lautstärke und 
Dissonanz bis an die Grenzen der Erträglichkeit erweitert und bei der 
Uraufführung einen historisch bedeutsamen Skandal ausgelöst. Honeg- 
gers Pacific 231 — die höchst elaborierte musikalische Interpretation der 


6 «Benché la caratteristica del rumore sia di richiamarci brutalmente alla vita, l'arte dei 
rumori non deve limitarsi ad una riproduzione imitativa. Essa attingerä la sua mag- 
giore facoltà di emozione nel godimento acustico in se stesso, che l'ispirazione dell’ar- 
tista sapra trarre dai rumori combinati.» 
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Geräusche einer Lokomotive — entstand 1924 und baute Material aus sei- 
ner Partitur zu Abel Gance’ LA Rove (Frankreich 1923) aus. Varèse, ein 
Freund Busonis und lebenslanger Kämpfer für die Befreiung der Musik 
aus den Fängen einer wohltemperierten Harmonik, setzte «Sternenkriege, 
Schlachtenrufe, rituelle Fanfaren, Dampfstöße, zusammenstoßende Erd- 
platten und zerschmetterte Schädel» (Toop 1995: 99) in avantgardisti- 
sche kompositorische Konzepte um. In Ameriques (1918-1921) integrierte 
er Sirenen als Symbole der Stadtlandschaft und eine Sturm- und eine 
Dampfschiffpfeife in die musikalische Konzeption. Ionisation (1931) kom- 
binierte Sirenen mit verschiedenen Schlaginstrumenten. Unter Varése’ 
Bewunderern waren der Jazz-Musiker Charlie Parker und die Rockle- 
gende Frank Zappa. Varése war nachweislich schon vor dem Krieg mit 
den futuristischen Ideen in Berührung gekommen (Lista 1975: 29), dis- 
tanzierte sich jedoch nach seiner Emigration in die USA ausdrücklich von 
dieser Bewegung. 

Varése’ Konzeptionen ruhten auf einem anderen, theoretisch und 
musikalisch fundierteren Gerüst. Wissenschaftliche Präzision in der Ana- 
lyse von Klangeigenschaften und ihre Integration in die kompositorische 
Strukturbildung waren für ihn unabdingbare Grundlagen des kreativen 
Schaffens. Wie Busoni sah er sich nicht in einer Pose rebellischer Negation 
traditioneller Werte, sondern versuchte vielmehr, den traditionellen Hori- 
zont zu erweitern. Einer seiner Grundgedanken war die Auflésung starrer 
metrischer und tonaler Skalen zugunsten von fließenden dynamischen 
Verschiebungen. Er sah in den neuen elektronischen Instrumenten keine 
Zerstörung, sondern eine wünschenswerte Erneuerung der musikalischen 
Kultur. Die herben Reaktionen des zeitgenössischen Publikums und der 
Kritik, die notorische Frage, ob seine Werke noch als Musik zu bezeichnen 
wären, brachten ihn Ende der 1920er-Jahre dazu, seine Kompositionen als 
organisierte Klänge und sich selbst als einen Arbeiter mit Rhythmen, Frequen- 
zen und Intensitäten zu bezeichnen (Varese 1962: 23). Wie Varese’ langjäh- 
riger Mitarbeiter Chou Wen-chung (1977: 52ff.) in einer Modellanalyse zu 
lonisation schreibt, ging es Varèse um «die Exploration der strukturellen 
Valeurs aller Nicht-Tonhöhen-Eigenschaftendes Schalls». Diese Eigen- 
schaften — Klangfarbe, Register, Artikulation und Rhythmus, zusammen- 
fassend als Texturen bezeichnet — werden über die kategoriale Einteilung 
zu Klangerzeugern spezifischen Funktionen zugeordnet. Die Basis der 
Kategorisierung bilden das Material — Metalle, Felle, Hölzer — und der 
Mechanismus der Schallerzeugung - Schlagen, Reiben, Blasen - im Ver- 
bund mit morphologischen Eigenschaften. 

Marinettis onomatopoetische Schilderungen des Krieges, Parole 
in liberta, begründeten eine weitere Kategorie der Geräuschkunst, die 
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Geräuschpoesie oder Lautdichtung, die Hugo Ball 1916 in Zürich zu sei- 
nen dadaistischen Poesien animierte und in den experimentellen Hörspie- 
len von Kurt Schwitters weiterlebte. 

Parallel zum Futurismus entwickelte sich in Russland eine reichhal- 
tige Fluktuation zwischen den verschiedenen ästhetischen Ausdrucksfor- 
men, die ihren Ursprung in mystischem und esoterischem Gedankengut 
hatte (Gordon 1992: 197 ff.). Eine zentrale Figur dieser Bewegungen war 
Wassily Kandinsky, dessen Überlegungen zum Kontrapunkt ich schon 
kurz dargestellt habe (> 134). 1910 setzt er sich in der einflussreichen 
Publikation Über das Geistige in der Kunst mit der historischen und philo- 
sophischen Dimension der Übertragung musikalischer Kompositionsprin- 
zipien auf die Malerei auseinander. Im Zentrum seiner Reflexionen steht 
die Komposition von Ton, Bild und geräuschhafter, nicht referenzieller 
Sprache mit den Mitteln von Rhythmus und Klang einerseits und die Phä- 
nomene der Synästhesie (> 138) — der Übertragung von Sinnesenergien 
in andere Wahrnehmungsbezirke — andererseits. Kandinsky importierte 
diese Ideen später in die künstlerischen Zirkel des Blauen Reiter und des 
Bauhauses in Weimar. 

Beeinflusst von der Anthroposophie Rudolf Steiners und dem indisch 
inspirierten mystischen Katechismus Madame Blawatzkys suchte er, in 
der Malerei eine innere Vibration darzustellen, welche der abstrakten 
musikalischen Erfahrung entsprach. Diese innere Vibration — von Kan- 
dinsky mehrfach Klang genannt - kommt zustande, wenn es dem Werk 
gelingt, eine Resonanz auszulösen. Nach Kandinsky ist der seelische Aus- 
tausch zwischen Werk und Betrachter dann vollkommen, wenn sich beide 
auf einer höheren geistig-seelischen Ebene treffen. Dieser Ansatz steht in 
deutlicher Abgrenzung zu den Ende des 19. Jahrhunderts üblichen positi- 
vistisch-materialistischen Auffassungen, die nur anerkennen, was gewogen, 
gemessen werden kann (Kandinsky 1910: 37). 


Nach der Periode der materialistischen Versuchung, welcher die Seele 
scheinbar unterlag und welche sie doch als eine böse Versuchung abschüttelt, 
kommt die Seele, durch Kampf und Leiden verfeinert, empor. [...] Unsere 
Seele [...] birgt in sich Keime der Verzweiflung des Nichtglaubens, des Ziel- 
und Zwecklosen. [...] In unserer Seele ist ein Sprung, und sie klingt, wenn 
man es erreicht, sie zu berühren, wie eine kostbare in den Tiefen der Erde 
wiedergefundene Vase, die einen Sprung hat. (Kandinsky 1910: 22) 


Im Bild der gesprungenen Vase wird erkennbar, dass der moderne 
Mensch stärker durch das berührt wird, was gewohnheitsmäßig als 
hässlich galt. Symbol dieser neuen Hässlichkeit ist die Dissonanz, die 
allein dadurch im Erleben wieder als schön empfunden wird, dass sie 
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einer inneren Notwendigkeit entspricht (Kandinsky 1910: 86). Damit legt 
Kandinsky die Wurzeln einer fundamentalen Wende in der Asthetik 
vieler Künste offen, die bis heute weiterwirkt und den Begriff des Schö- 
nen aus einer neuen Perspektive beleuchtet, mithin den relationalen, 
zeitgeistig bedingten Aspekt der Wahrnehmung und Bewertung ein- 
bezieht. 

Im russischen Umfeld der Geräuschkunst war es Dsiga Wertow’, 
Godards großes Vorbild, der als Erster dokumentarische Tonaufnahmen 
mithilfe eines Pathephone-Wachsplattenspielers zu montieren versuchte 
(Kahn 1992: 10). Inwiefern es ihm gelungen ist, darüber schweigt Kahn 
sich aus. Wertow meinte ebenso wie die Futuristen, dass die Grenzen tra- 
ditioneller Musik gesprengt werden sollten. Aufgerieben von den tech- 
nischen Schwierigkeiten gab er die Arbeit am Ton auf, um sich dem Bild 
zuzuwenden. Auf den Wachsplatten, die damals als Speichermedien zur 
Verfügung standen, konnten Klänge nur unter Verlust einer weiteren 
Generation montiert werden, indem sie nach einem genauen Protokoll 
nacheinander zugespielt wurden. Die Klangobjekte ertranken bis zur 
Unkenntlichkeit im Rauschen, elektrische Verstärkung gab es noch nicht, 
die Aufnahmen erfolgten mit akustischen Trichtern, deren Schwingun- 
gen direkt auf die Schallplatte aufgezeichnet wurden. Die technischen 
Voraussetzungen zu Wertows Idee waren erst zehn Jahre später geschaf- 
fen, als der Lichtton die Montage verschiedener Geräuschaufnahmen 
ermöglichte. In seinem ersten Tonfilm Entuziazm / Sinfonija Donbassa 
(Russland 1930) kommt er auf seine ursprünglichen Ideen zurück und 
montiert die Geräusche des industriellen Reviers (Vertov 1931: 124) — unter 
anderem Glocken, Fabriksirenen und Maschinen - mitmusikalischem 
Feinsinn. 

Awraamow, wie Wertow ein Russe, orchestrierte gleich die Geräusch- 
quellen selbst, statt sie auf technisch mangelhaftes Material aufzunehmen. 
Für den fünften Jahrestag der Russischen Revolution komponierte er 1922 
eine Symphonie für Fabriksirenen. Neben den Fabriksirenen von Baku 
und einem gigantischen Chor waren die Nebelhörner der gesamten Kas- 
pischen Flotte, zwei Artilleriedivisionen, Infanterie mit Maschinenge- 
wehren und Wasserflugzeuge zu hören (Gordon 1992: 220). Dirigenten, 
die über die ganze Stadt verteilt waren, haben dieses kolossale Orchester 
mit Pistolenschüssen und Flaggen koordiniert. Am Ende mündete das 
bruitistische Spektakel mit der Marseillaise und der Internationalen in ein 
gewaltiges Finale. Eine ähnliche Verquickung von Bewegung, Maschine 
und Kriegsgeräuschen mit patriotischer Gesinnung wie im futuristischen 


7 Seine Schriften sind unter dem Namen Dziga Vertov erschienen. 
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Gedankengut strömt aus dieser machtvollen Inszenierung des totalen 
Sounds. 

Weiter etablierte sich im Kontext der Radiokunst in Deutschland seit 
1924 die kompositorische Arbeit mit Geräuschen. Als eines der frühesten 
Beispiele zitiert Cory (1992: 33) Hans Fleschs Zauberei auf dem Sender, wel- 
cher mit Kontrasten, unmotivierten Toneffekten und verzerrten musika- 
lischen Tempi den Machtkampf zwischen dem künstlerischen Direktor 
eines Senders und einem Zauberer darstellte. Hörbilder — die klangliche 
Darstellung von Orten - ebenfalls von Flesch und seinem Nachfolger 
Hans Bodenstedt folgten. 1926 nannte Alfred Braun seine Produktion 
DER TÖNENDE STEIN einen akustischen Film (Cory 1992: 33). Unter dem 
Einfluss von Bert Brecht, der 1929 mit dem Ozeanflug einen Meilenstein 
des Hörspiels geschaffen hatte, propagierte der Komponist Kurt Weill 
eine absolute Radiokunst, welche Tier- und Menschenschreie, natürliche 
Geräusche von Wind und Wasser sowie künstliche Geräusche mit musika- 
lischen Rhythmen und Melodien verbinden sollte (Cory 1992: 46). 

Bekanntestes frühes Beispiel einer Geräuschkunst ist Walter Rutt- 
manns WEEKEND (Deutschland 1930). Ruttmann hatte sich seit 1919 
zusammen mit Viking Eggeling und Hans Richter im Kontext der breiter 
angelegten paneuropäischen Aufbruchstimmung mit der Übertragung 
von musikalischen Kompositionsprinzipien auf die Montage von abs- 
traktem Bildmaterial beschäftigt (Brinckmann 1997: 247 ff.). WEEKEND, ein 
Film ohne Bild, ist eine stellenweise witzige und - angesichts der techni- 
schen Limiten — sehr gekonnte Montage von Klangobjekten auf Lichtton. 
Neben der semantischen Kohärenz, die dem Thema entlang verschiedene 
Stationen eines Wochenendes andeutet, entwickelt Ruttmann klangliche 
Stränge, die sich aus der rhythmischen Anordnung ähnlich klingenden 
Materials ergeben. Dazu gehören Sequenzen von perkussiven und stamp- 
fenden Maschinen- und Handwerksgeräuschen mit Registrierkassen 
und startenden Motoren. Obwohl jeweils nur ein Klangobjekt zu hören 
ist, erzeugt Ruttmann im Sinne eines Streaming verschiedene Schichten, 
indem er die Elemente in kurzen Intervallen alternierend montiert. Spra- 
che und Musik lösen ihre codierte Kohärenz auf und haben als kurze Aus- 
schnitte nur noch hinweisende Funktion auf Situationen und Schauplätze. 

Zwanzig Jahre später — 1948 — bezeichnete Pierre Schaeffer solche 
Kompositionen mit konkretem, das heißt, in der natürlichen Umwelt vor- 
gefundenem akustischem Material als Musique concrete. Dieses Material 
haben er und Pierre Henry in den ersten Jahren auf Schallplatten und 
später auf Tonband aufgenommen. Verfremdet und rhythmisiert wur- 
den die Geräusche in einen neuen Kontext montiert. Die Rhythmisierung 
von einzelnen Klangobjekten war eines der Hauptverfahren, mit denen in 
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der Musique concrète natürliches Klangmaterial musikalisiert wurde, weil 
eines der wichtigsten Unterscheidungsmerkmale zwischen Musik und 
natürlichen Geräuschen die regelhafte Struktur der Musik ist, die sich an 
einem metrisch definierten Rhythmus orientiert. In natürlichen Lautsphä- 
ren kommen solche Rhythmen nur in mechanischen, von Menschen oder 
Maschinen verursachten Abläufen vor. Technisch wurden solche Rhythmi- 
sierungen von Pierre Schaeffer und Pierre Henry durch den sogenannten 
Sillon fermé erzeugt, bei welchem die Rillen einer Schallplatte so abgedich- 
tet wurden, dass der Effekt eines Sprungs in der Platte entstand. Später 
haben sie Magnetband ringförmig zu Endlosschleifen zusammengeklebt. 

Schaeffer grenzte sich mit der Musique concrete nicht nur von der 
klassischen tonalen Musik ab, sondern auch von der zeitgenössischen 
seriellen oder elektronischen Komposition, die auf mathematischen und / 
oder stochastischen Prinzipien aufbaute (Chion 1983: 39). Schaeffer, der 
ursprünglich Maschinenbauingenieur war und dann Direktor des franzö- 
sischen Rundfunks wurde, hat sich 1966 im Traité des objets musicaux mit 
allen klanglichen Aspekten von Geräuschen auseinandergesetzt. Ähnlich 
wie Varése ging es ihm um ein tiefgreifendes Vordringen in die klangli- 
che Materie, die das Rohmaterial für die strukturierte Anordnung bilden 
sollte. Im Unterschied zu Russolos Ansatz, der ausschließlich mit abstrak- 
ten, nicht referenziellen Geräuschen arbeitete, arrangierten Schaeffer und 
Henry auch Klangobjekte — unter anderem Lokomotiven-, Wasser- und 
Geschirrgeräusche -, die in einem semantischen Bezug zueinanderstan- 
den, jedoch unter dem Aspekt ihrer klanglichen Verwandtschaft. Ihren 
Klangkonzeptionen fehlt der rebellische Impetus des Lauten, Rohen und 
Wilden. In ihren Werken ist alles Struktur, organisiert von einem analy- 
tischen Intellekt und feinem Spürsinn für die klangliche Dimension der 
Geräusche. 


Als ich 1948 den Begriff Musique concrete vorgeschlagen habe, wollte ich mit 
dem Adjektiv eine Umkehr in der Richtung der musikalischen Arbeit aus- 
drücken. Statt musikalische Ideen über die Symbole des Notationssystems 
wiederzugeben und ihre konkrete Umsetzung bekannten Instrumenten an- 
zuvertrauen, ging es hier darum, das konkrete Klangmaterial dort zu sam- 
meln, wo es herkommt, und daraus das große Potenzial an Musikwerten zu 
abstrahieren, die es enthält.® (Schaeffer 1966: 23) 


8 «Lorsqu’en 1948 j'ai proposé le terme de »musique concrète», j'entendais, par cet adjec- 
tif, marquer une inversion dans le sens du travail musical. Au lieu de noter des idées 
musicales par les symboles du solfège, et de confier leur réalisation concrète à des ins- 
truments connus, il s'agissait de recueillir le concret sonore, d’où qu'il vienne, et d'en 
abstraire les valeurs musicales sonores qu’il contenait en puissance.» 
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Der Einfluss des kompositorischen Schaffens von Pierre Schaeffer und 
Pierre Henry auf die Tonproduktion der 1970er-Jahre darf nicht unter- 
schatzt werden. Stellvertretend fiir viele sei Walter Murch zitiert: 


Mitte der 50er-Jahre lebte ich in New York und hatte ein Tonbandgerät an 
mein Radio angeschlossen. Als ich eines Nachts nach Hause kam und den 
WBAI anstellte, konnte ich nicht glauben, was ich hörte. Es war keine elek- 
tronische Musik wie die von Ussatschewski vom Columbia Princeton Music 
Center und auch keine Theremin-Einleitung zur Long John Nebel-Radiosen- 
dung. Es war etwas anderes - alle Klänge waren echte Geräusche. Deshalb 
habe ich das Tonbandgerät eingeschaltet, saß eine halbe Stunde dort, habe 
zugehört und mich gewundert [...].’ (Murch in LoBrutto 1994: 84) 


Nicht die Migrationsbewegungen der avantgardistischen Ideen aus 
Europa nach Amerika stehen im Fokus dieses historischen Exkurses, son- 
dern die Grenzüberschreitungen zwischen Musik und Geräusch. Eines 
wird klar: Helmholtz’ ursprüngliche Unterscheidung muss auf der Folie 
der neueren Entwicklung überdacht werden. Der hedonistische Aspekt, 
der Genuss, den ein Klang oder eine Klangkomposition bietet, ist an 
keine festen physikalischen Gesetzmäßigkeiten gebunden, wie Helm- 
holtz glaubte, sondern eine Folge der Akkulturation und der individuel- 
len Wertung. Einen Techno-Freak können Sopran-Arien tierisch abnerven, 
ein Liebhaber klassischer Musik wird im Technosound überhaupt nichts 
Musikalisches entdecken, der satte Motorensound einer Harley-Davidson 
dagegen ist Musik in den Ohren ihres Besitzers. Oder wie Höge (1986: 55) 
schreibt: «Jedes Schallereignis kann als Lärm bezeichnet werden, wenn es 
stört.» 

Mit der Auflösung traditioneller tonaler Harmonik, mit der struktu- 
rellen Anordnung von Geräuschen nach musikalischen Prinzipien muss 
die Frage nach Unterschieden und Gemeinsamkeiten von Geräusch und 
Musik neu gestellt werden. Die physikalischen Aspekte dieser Frage wer- 
den in die entsprechenden Kapitel ausgelagert (> Klangfarbe 203, > Mate- 
rial 335). 

Aus den Überlegungen Russolos, aus Schaeffers und Henrys Arbei- 
ten gehen zwei Hauptelemente der Musikalisierung von Geräuschen her- 
vor: 


9 «ln the mid-fifties I was living in New York and I had a tape recorder attached to my 
radio. I came home one night, turned on WBAI, and I couldn't believe what was com- 
ing out of the radio. It wasn’t electronic music like Ussachevsky of the Columbia Princ- 
eton Music Center or the Theremin introduction on the Long John Nebel radio show. 
This was something else — the sounds were all real sounds. So I turned on the tape 
recorder and sat there for the next half-hour, listening and wondering [...].» 
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a) die Lösung des Geräuschs aus seiner ausschließlich referenziellen Be- 
ziehung zur Quelle, das heißt, die Abstraktion von jener semantischen 
Dimension, die in den Kapiteln 3 und 5 (> Semantik erster Ordnung 100, 
— Semantik höherer Ordnung 158) ausführlich behandelt wurde 

b) die strukturelle Anordnung von Geräuschen aufgrund ihrer klangli- 
chen Dimension 


Nichtreferenzialität ist das wichtigste Kriterium zur Unterscheidung 
der Musik von Sprache und Geräusch. Physikalisch gesehen, teilen ein 
Geigenton und das Miauen einer Katze eine Reihe von überraschenden 
Gemeinsamkeiten. Dennoch würde eine Mehrheit potenzieller Probanden 
das Miauen der Kategorie Geräusche und die Geige der Kategorie Musik 
zuteilen. Zwar verfügt der Geigenklang auch über einen referenziellen 
Aspekt: den Hinweis auf das Instrument; sein ausschließlicher Anwen- 
dungsbereich im Kontext Musik ist jedoch viel ausgeprägter als der Hin- 
weis auf die Quelle. 

Die Musik ist weitgehend ein selbstreferenzielles System, das auf 
nichts anderes verweist als auf sich selbst. Dieses Losgelöstsein von einer 
außermusikalischen Wirklichkeit hat zu Beginn des Jahrhunderts die bil- 
denden Künstler fasziniert, als sie sich vom Zwang der Gegenständlich- 
keit befreiten und nach abstrakten Kompositionsprinzipien suchten. 

Ein gewisses Maß an Referenzialität höherer Ordnung gewinnt die 
Musik durch die stilistischen Codes und weitere programmmusikalische 
Elemente. Diese Codes spielen besonders im Kontext Filmmusik eine 
besondere Rolle. Busoni wertet sie allerdings als primitive Abweichung 
von der absoluten Musik: 


Das wahrnehmbarste von ihnen, die Erniedrigung des Klanges zu Schall, bei 
Nachahmung von Naturgeräuschen: das Rollen des Donners, das Rauschen 
der Bäume und die Tierlaute; und schon weniger wahrnehmbar, symbolisch, 
die dem Gesichtssinn entnommenen Nachbildungen, wie Blitzesleuchten, 
Sprungbewegungen, Vogelflug; nur durch Übertragung des reflektierenden 
Gehirns verständlich: das Trompetensignal als kriegerisches Symbol, die 
Schalmei als ländliches Schild, der Marschrhythmus in der Bedeutung des 
Schreitens, der Choral als Träger der religiösen Empfindung. Zählen wir 
noch das Nationalcharakteristische - Nationalinstrumente, Nationalweisen — 
zum vorigen, so haben wir die Rüstkammer der Programmusik erschöpfend 
besichtigt. (Busoni 1907: 15) 


Geräusche ohne referenziellen Bezug sind auf der anderen Seite die bereits 
besprochenen UKOs (> 126), mit denen auch Russolo operierte. Maximale 
Referenzialität ist im prototypischen Klangobjekt zu finden, dessen einzi- 
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ger Zweck der Hinweis auf eine Quelle darstellt. Zwischen fehlender und 
maximaler Referenzialitat sind verschiedene Abstufungen denkbar. Sie 
korrelieren mit dem Grad an klanglicher Ausdifferenzierung von Geräu- 
schen. Irgendwo dazwischen bewegt sich der Aspekt der materiellen 
Grundlage von Klangobjekten, der sowohl einer bestimmten Klanglich- 
keit zuzuordnen ist als auch eine physikalische Beschaffenheit der Quelle 
markiert. 

Immer ist im Geräusch auch eine spezifische Klangkomponente vor- 
handen, die unter dem Aspekt der Strukturbildung zu anderen in Bezie- 
hung gesetzt werden kann. Diese Klangkomponente zu erkennen und 
zu nutzen - und übrigens auch zu analysieren - ist eine der schwierigs- 
ten Aufgaben nicht nur des Sound Design, sondern auch der kritischen 
Beschäftigung mit der Tonspur. Sie setzt mentale Abstraktion voraus. 
Ohne willentliche Konzentration erschließt sich der bewussten Wahrneh- 
mung zuerst der semantische Aspekt des Geräuschs. 

Diese Hörweise, die ihr Bewusstsein auf die klanglichen Aspekte 
fokussiert, nannte Schaeffer écoute réduite. Chion hat im Guide des objets 
sonores (1983), das als eine Interpretationshilfe des schwer verständlichen 
Traite des objets sonores von Schaeffer zu verstehen ist, den Begriff folgen- 
dermaßen erklärt: 


1) Die écoute réduite ist eine Hörweise, die darin besteht, einen Ton als sol- 
chen, als Klangobjekt wahrzunehmen, indem man von seiner tatsächlichen 
oder angenommenen Herkunft sowie von der Bedeutung, die er trägt, abs- 
trahiert. 

2) Im «gewöhnlichen» Hören fasst man den Ton immer als Vehikel auf. Die 
écoute réduite ist deshalb eine «unnatürliche» Herangehensweise, die sich 
allen Konditionierungen entgegenstellt. Von den gewohnheitsmäßigen Be- 
zügen des Hörens zu abstrahieren, ist ein willentlicher und künstlicher Akt, 
der es uns erlaubt, eine große Anzahl von verborgenen Phänomenen unserer 
Wahrnehmung zu erhellen. 

Die écoute réduite ist also mit Bezug auf den Begriff der phänomenologi- 
schen Reduktion benannt. (Chion 1983: 33) 


10 «1) L’écoute réduite est l'attitude d'écoute qui consiste à écouter le son pour lui-même, 

comme objet sonore en faisant abstraction de sa provenance réelle ou supposée, et du 
sens dont il peut étre porteur. 
2) Dans l'écoute <ordinaire>, le son est toujours traité comme véhicule. L’écoute réduite 
est donc une démarche <anti-naturelle», qui va contre tous les conditionnements. L'acte 
de faire abstraction de nos references habituelles dans l'écoute est un acte volontariste 
et artificiel qui nous permet d’élucider un grand nombre des phénoménes implicites de 
notre perception. L’écoute réduite est ainsi nommée par référence a la notion de réduc- 
tion phénoménologique.» 
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Mit Reduktion meint Schaeffer also bildlich gesprochen das perzeptive 
Herausschälen der genuin klanglichen Eigenschaften des Geräuschs, die 
dann als Material für die Komposition zur Verfügung stehen. 


Verfremdung 


Fantastische Elemente, die keinen realen Ursprung haben - seien dies 
futuristische Raumstationen aus der fernen Zukunft oder Dinosaurier aus 
der fernen Vergangenheit — lassen Raum für ungewöhnliche Tonkompo- 
sitionen. Niemand hat je ein Laserschwert gehört, niemand weiß, wie es 
klingt, wenn sich ein Cyborg in flüssigem Aggregatzustand durch Hinder- 
nisse schleust. 

Wenn es darum geht, solche Drehbuchideen und optischen Tricks mit 
einem Klang zu versehen, hat die Stunde der echten Audiophilen geschla- 
gen. Mit kühner Imagination greifen sie zu einer Dose Hundefutter, um 
das sumpfige Schlürfen des flüssigen Terminators zu generieren, wie Gary 
Rydstrom für TERMINATOR 2 (USA 1991, James Cameron). Es ist das Glück 
dieser Leute, dass die Zuschauer in einer visuell dominierten Kultur leben 
und daher nicht in der Lage sind, sich die tatsächliche Quelle eines Klang- 
objekts — das Hundefutter nämlich - zu vergegenwärtigen. 

Diese Manipulationen müssen jedoch einige Regeln und Erwartun- 
gen berücksichtigen, um glaubwürdig zu sein. «Brontosaurier-Schritte 
können beispielsweise hergestellt werden, indem man Kokosnussscha- 
len in einem Salzblock reibt, der sich auf einer Basstrommel befindet»! 
(Nisbett 1993: 245). Die Schritte von Brontosauriern kommen in unserer 
Alltagserfahrung nicht vor, müssen also etabliert werden. Die Regelhaf- 
tigkeit, die dabei ins Spiel kommt, beruht auf einem Zusammenspiel von 
Ähnlichkeit und Differenz. Damit kommen wir auf das Konzept des Mehr- 
werts (> 142) zurück. Dort hatte ich postuliert, dass die Ton-Bild-Bezie- 
hung dann den größten Mehrwert produziert, wenn sich die visuelle und 
akustische Repräsentation nicht völlig decken und damit Redundanz pro- 
duzieren, sondern wenn zwischen ihnen eine gewisse Kluft besteht. Dabei 
müssen multiple Randbedingungen erfüllt werden, damit die Konzepte 
miteinander interagieren. Das ist im Beispiel der Brontosaurier-Schritte 
die Ähnlichkeit zu Schritten von anderen großen Vierbeinern und die 
Betonung der Größe, darum die Basstrommel, welche Masse simuliert. 
Dass niemand bei diesem Geräusch an Kokosnussschale auf Salzblöcken auf 


11 «For example, brontosaurus’ footsteps can be made by grinding coconut shells into 
blocks of salt on a bass drum.» 
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einer Basstrommel denken wird, griindet auf dem Mechanismus von Erwar- 
tung und Hypothese (man unterstellt dem Film eine kohärente Intention) 
oder auch auf einer gewissen Bequemlichkeit, welche uns dazu bringt, 
mit einer gewissen Naivität das Nächstliegende zu glauben, und das ist 
in diesem Fall das Schrittgeräusch von Brontosauriern, weil das Bild uns 
dies nahe legt. 


Geschichtliche Wurzeln 


Im frühen Kino war es der Mann am Schlagzeug, der die Geräusche syn- 
chron zum Geschehen auf der Leinwand erzeugte. Er war die frühe Ver- 
sion eines Geräuschemachers. Statistische Angaben über seine Tätigkeit 
fehlen jedoch; weder ist bekannt, in welcher Zeit er auftauchte, noch wis- 
sen wir, in welchen Genres und an welchen Orten er agierte. Ein rares 
Dokument zur Geräuschtechnik im Stummfilm ist Serks Les Bruits de cou- 
lisses au cinema (1914), ein Handbuch für den Sound Designer der Früh- 
zeit. Serk beschreibt die Techniken der virtuellen Geräuschproduktion im 
Stummfilmkino von akustischen Schlachtengemälden bis zu den Geräu- 
schen der Natur: Tierschreie, Pferdegalopp, Meeresbrandung. Typologisch 
gehören diese Techniken der Geräuscherzeugung zur Klangsubstitution, 
bei welcher die Geräusche von Objekten durch andere Klangerzeuger 
produziert werden, wie beispielsweise Pferdegetrappel durch Kokosnuss- 
schalen, das Serk (1914: 10) zwar bereits beschreibt, aber nur als beschränkt 
befriedigend darstellt. 


Ohne Zweifel liefern echte Hufeisen, die auf feste Holzblöcke genagelt sind 
und an Riemen von den Maschinisten gehalten werden, ebenfalls hervor- 
ragende Resultate. Aber es braucht nicht nur viel Übung und eine gewisse 
Geschicklichkeit, um den Galopp, den Trott usw. perfekt zu imitieren, einige 
hat die Sorge um den Realismus sogar so weit getrieben, Techniken zu ent- 
wickeln, um den Eindruck von Pferdehufen auf hartem Boden oder ihr Ein- 
sinken in sandiges Terrain wiederzugeben." (Serk 1914: 10) 


Die Geräuschsubstitution der Stummfilmzeit baute auf einem elaborier- 
ten Vokabular auf, das im Theater seit der Frühzeit entwickelt worden 
war. Reichhaltige Informationen über die antiken Wurzeln der virtuel- 


12 «Sans doute de véritables fers de cheval, cloués sur des blocs de bois dur maintenus par 
des courroies aux mains des machinistes, donnent aussi d’excellents résultats; mais, 
non seulement il faut une grande habitude et une certaine habileté pour imiter parfai- 
tement le galop de charge, le trot, etc., mais certains ont poussé le souci du réalisme 
jusqu’à rechercher les moyens de donner l'impression de pas de chevaux frappant le 
sol durci ou s’enfoucant dans le terrain sablonneux.» 
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len Klangproduktion entdeckt man in der Publikation Macht und Klang. 
Tönende Automaten als Realität und Fiktion in der alten und mittelalterlichen 
Welt von Reinhold Hammerstein (1986). Die Automaten der Antike hatten 
gleichzeitig eine kultische und eine mimetische Funktion. Sie sollten nicht 
nur Donner oder Vogelgezwitscher darstellen, sondern auch durch Stau- 
nen belehren. Die kultische Dimension war an die sorgfältige Maskierung 
des klangerzeugenden Mechanismus gebunden, der in geheimen Räumen 
verborgen war, sodass es schien, als ob übernatürliche Kräfte die Tätigkeit 
der Automaten erzeugten. 

Diese Toneffekte, die im Tempel und im Theater gleichermaßen 
eingesetzt wurden, hat man im Laufe der Jahrhunderte verfeinert. Die 
Bleikugeln aus Herons Donnerautomat (> 356) wurden durch riesige 
Donnerbleche ersetzt, welche wuchtiger und überzeugender klangen. 
Windmaschinen, bestehend aus rotierenden Holzzylindern, die an Texti- 
lien entlangschleiften, erzeugten tosende Hurrikane, Erbsen und Bleiku- 
geln in Sieben und Trommeln vertonten je nach Handhabung Regen oder 
Brandung. Viele dieser Techniken der Geräuschsubstitution haben bis 
heute überlebt. 

Die Effekte in Theater und frühem Kino sind Klangimitationen und 
bleiben als solche erkennbar. Sie werden mit der Absicht erzeugt, nicht 
sich selbst, sondern etwas anderes zu bezeichnen. Zwar hat man ihre 
Quellen vor dem Publikum verborgen - Serk (1914: 9) schlägt bereits eine 
Geräuschbühne hinter der Leinwand vor -, dennoch dürfte ihre Qualität 
von einer realitätsnahen Imitation so weit entfernt gewesen sein, dass sie 
den Charakter des Gemachten tragen; sie sind also Artefakt statt Abbild. 

Im frühen Kino standen Hupen, Zugpfeifen und Sirenen dem Mann 
am Schlagzeug als reale Instrumente zur Verfügung. Auch das Geschirr in 
der Kiste, in die er mit dem Hammer fuhr, wenn es nötig wurde, war echt. 
Losgelöst von ihrem akustischen Umfeld, als isolierte klangliche Ereig- 
nisse, haben diese Geräusche trotzdem nicht realistisch geklungen. Der 
Raum, in dem sie produziert wurden, war immer der Kinosaal und nicht 
der imaginäre Raum der filmischen Erzählung. Nicht der Wunsch nach 
Realismus, so scheint es, sondern das Verlangen nach Dramatisierung und 
Beschleunigung waren die Beweggründe dafür, Toneffekte im Lichtspiel- 
haus zu erzeugen. Mit zunehmender Erfahrung mit dem Film als Medium 
gab es vermutlich eine ausdifferenzierte Zuweisung der Geräusche zu 
bestimmten Genres. Dettke (1995: 46) jedenfalls berichtet, dass Schmidt- 
Gentner, der bekannte Kinokapellmeister des Alhambra in Berlin, klir- 
rende Scheiben, Geklapper und Gehupe nur bei Grotesken verwendete. 
Generell ist anzunehmen, dass besonders Action-geladene Genres von 
Geräuschen begleitet wurden. 
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Einzelne perkussive Akzente - Türen zuschlagen, Geschirr zer- 
schmettern, Ohrfeigen, Schüsse und Pferdegetrappel - rhythmisierten den 
Ablauf, dramatisierten durch den Überraschungseffekt, verbunden mit 
Lautstärke, und überhöhten flüchtige Ereignisse. Sie standen in der Tradi- 
tion des Slapstick. 


Der Begriff Slapstick geht zurück auf eine äußerst physische Form der Ko- 
mödie in der Tradition von Vaudeville oder Burleske. Damals wurde ein 
ganzes Sortiment von Requisiten und Schlaginstrumenten eingesetzt, um die 
verschiedenen Hiebe, Stiche und Klapse zu betonen, mit denen sich die Ak- 
teure dieser Volksbelustigung traktierten. Das bekannteste dieser Werkzeuge 
war der Slapstick (dt. Narrenpritsche) [...]. Obwohl die Geräusche bestimmte 
körperliche Aktionen unterstreichen sollten, signalisierten sie dem Publikum 
auch, dass die Handlung keinen Realitätsbezug hatte und nicht ernst genom- 
men zu werden brauchte." (Mott 1989: 80) 


Kino-Orgeln mit speziellen Geräuschregistern (ausführlich dargestellt in 
Dettke 1995) und Geräuschmaschinen, die Noiseograph, Dramagraph, Kine- 
matophone, Soundograph hießen, wurden um 1908 entwickelt, um die Skala 
der Toneffekte zu erweitern und ihre Produktion zu automatisieren. Auch 
hier dominierten besonders bedeutungsvolle Geräusche wie Donner, 
Wind und Sturm, Tierstimmen, Hupen, Sirenen, Telefonklingeln und Glo- 
cken (Fielding 1980: 4; Dettke 1995: 448 ff.). 

Erst in den späten 1920er-Jahren brachte die Deutsche Grammophon 
Geräuschplatten mit Originalaufnahmen auf den Markt. Das Radio hatte 
die Hörgewohnheiten verändert. «Das Radio hatte etwas Besseres... die 
Imagination der Zuhörer! [...] Das Radio brauchte nur Bilder durch sug- 
gestive Töne zu erzeugen, um diese magische Welt der Fantasie zu öffnen» 
(Mott 1989: 4).'* Anders als die Toneffekte im Lichtspiel sollten die Tonef- 
fekte im Radio die Realität simulieren, um die Imagination des Hörers zu 
nähren. Deshalb trennte sich das Hörspiel von den rohen Geräuschimita- 
tionen des Kinos und des Theaters. In ihrem Bemühen, die Realität abzu- 
bilden, gingen die Regisseure so weit, selbst das Klimpern von Juwelen 


13 «The term slapstick comes from a highly physical form of comedy that was done in 
vaudeville and burlesque. In those days, an assortment of props and drummer’s traps 
were used to accent the numerous slaps, punches, and hits that the participants of this 
broad comedy form rained on one another. The most popular of these devices was a 
slapstick. [...] Although the sounds were added to punctuate certain physical acts, the 
sounds also told the audience that these acts were totally without relation to reality and 
therefore should not be taken seriously.» 

14 «Radio had something better ... the listener’s imagination! [...] All radio had to do to 
avail itself of this magical world of fantasy was to create images through the suggestion 
of sound.» 
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mit echten 100.000-Dollar-Juwelen unter strenger Bewachung zu produ- 
zieren (Mott 1989: 14, von Bild verifiziert). 

Die Geräuschproduktion der ersten Filme orientierte sich am formel- 
haften Repertoire des Stummfilms. Clair wunderte sich nach der Visionie- 
rung von einem Dutzend Spielfilmen über das stereotype Vokabular der 
Tonspuren: 


Die Jazzprobe, das bewegende Lied, der Stundenschlag, der Kuckucksruf, 
Applaus im Dancing, der Automotor und das zerbrechende Geschirr, alles 
das ist ohne Zweifel sehr angenehm, aber nachdem man es sich zehnmal in 
zehn verschiedenen Filmen anhören musste, erträgt man es nicht ohne Über- 
druss.” (Clair 1929: 145f.) 


Aus historischer Distanz macht er selbst (Clair 1950: 146) die beschränkte 
Qualität des Aufnahmematerials für die frühe Stereotypisierung verant- 
wortlich: «Zu Beginn des Tonfilms nahm man mehr oder weniger alle 
Töne auf, die das Mikrofon fassen konnte. Man bemerkte jedoch schnell, 
dass die direkte Wiedergabe der Wirklichkeit einen sehr realitätsfernen 
Eindruck erzeugte und dass darum die Töne ebenso wie die Bilder ausge- 
wählt werden mussten. »'6 

Einige der frühesten Tonfilme waren stumm gedreht und mit Ton- 
effekten und Musik in Warners Vitaphone System (> 31) nachvertont wor- 
den: SuNRISE (USA 1927, F. W. Murnau), THE WınD (USA 1927, Victor 
Sjöström), Wincs (USA 1927, William Wellman). Viele andere wurden im 
Studio gedreht, wobei ein Geräuschemacher in einer schalldichten Zelle 
die Geräusche live synchronisierte. 

Zwei Linien von Geräuschproduktion lassen sich an der Schwelle 
zur Tonfilmzeit unterscheiden: das Geräusch als Spektakel, als zur Schau 
gestelltes, mehr oder weniger virtuoses Artefakt, und das Geräusch, das 
hinter sich selbst zurücktritt, das seine eigenen Spuren dissimuliert, um 
aufetwasanderes, auf eine denkbare Realität hinzuweisen. Das Geräusch 
als Bedeutungsträger, als Erweiterung des erzählerischen Stroms, das 
Geräusch als Kommentar oder als expressives Stilmittel, das Geräusch 
zur Kennzeichnung von Gemütszuständen der Figuren nimmt in den Fil- 
men der Frühzeit eine einmalige Stellung ein. Deshalb war es gerade das 


15 «La répétition de jazz, la chanson émouvante, l'horloge qui bat, le coucou qui sonne, les 
applaudissements dans le dancing, le moteur d’automobile et la vaisselle cassee, tout 
cela est sans doute fort gentil, mais ne se supporte pas sans quelque lassitude après une 
dizaine d’auditions dans dix films différents.» 

16 «Au début du film sonore on enregistrait 4 peu pres tous les sons que pouvait capter le 
microphone. On remarqua bien töt que la reproduction directe de la réalité donnait une 
impression aussi peu réelle que possible et que les sons devaient étre choisis au méme 
titre que les images.» 
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Kino, das die Verfremdung von vorgefundenem akustischem Material 
initiierte. 

Ein früher Meister der narrativen Integration von Verfremdungen 
war Alfred Hitchcock. Bereits in seinem ersten Tonfilm BLACKMAIL (Groß- 
britannien 1929) wandte er solche Manipulationen an, unter anderem in 
der schreiähnlichen Intonation einer Hupe, die erklingt, als die schockierte 
Alice auf einer Reklametafel des Picadilly Circus ein aufleuchtendes Mes- 
ser erblickt. Die Schrei-Hupe-Assoziation kommt später — ausgearbeitet — 
in THE 39 STEPS (GB 1935) nochmals zur Anwendung. Vergleichbar damit 
sind die Assoziation Klopfen-Maschinengewehr, die in Pabsts KAMERAD- 
SCHAFT (Deutschland /Frankreich 1931) eine Rückblende in die Vergan- 
genheit des Ersten Weltkriegs einleitet, oder ein Traum in Mamoulians 
APPLAUSE (USA 1929), in welchem verschiedene verfremdete Musikaus- 
schnitte in einer komplexen Assoziationskette miteinander verwoben 
werden, die - ähnlich wie in Ruttmanns WEEKEND (1930) — verschiedene 
Situationen zeichenhaft vertreten. Solche Verfremdungen, welche die 
Wahrnehmungen von Filmfigurenmarkierenoder simulieren, sind in der 
Mehrzahl klar erkennbar, weil die Transformation als solche eine kom- 
munikative Funktion hat. Mit diesem Komplex werde ich mich im Kapitel 
Subjektivierungen (> 362) eingehend befassen. 

Andere Formen von erkennbaren Verfremdungen sind ungewöhnli- 
che Ton-Bild-Verknüpfungen, zu denen auch die eingangs erwähnte Hun- 
defutter-Cyborg-Verbindung gehört oder eines der frühesten Beispiele 
des Korpus: die Dinosaurierschreie und das Brüllen von KINc Kong (USA 
1933, Cooper/Schoedsack), das Murray Spivack herstellte, indem er in 
ein Megafon blies und das dabei entstehende Grollen mit einem verlang- 
samten und somit in die Basslage transponierten Löwengebrüll kombi- 
nierte. 

Die äußerste Künstlichkeit stellen die Klangobjekte des Anima- 
tionsfilms dar. Diese sogenannten Cartoon-Sounds stehen in der Tradi- 
tion der Drummer’s Traps zur Zeit von Vaudeville-Burleske und Slapstick. 
Es sind in Klang zurückübersetzte Onomatopöen. Onomatopöen sind 
lautmalerische sprachliche Bezeichnungen, wie sie in Comics gehäuft 
vorkommen: Boing!, Zack!, Splash!, Whoosh! usw. Wolff (1995: 186 f.) hat 
dafür den Begriff Geräusch-Gimmick geprägt, mit welchem er jedoch 
sämtliche Geräusche, «die weder Vorstellungen über eine konkrete 
Quelle noch über eine konventionalisierte Bedeutung hervorrufen», 
bezeichnet, somit jene Klasse von Geräuschen, die wir als unidentifizier- 
bare Klangobjekte klassifiziert haben. Die Beispiele, mit denen Wolff den 
Begriff Gimmick illustriert, sind jedoch solche Cartoon-Sounds. Von den 
UKO unterscheiden sie sich deutlich durch den referenziellen Bezug auf 
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die Objekte und Handlungen, die im Bild — wie abstrakt auch immer — 
dargestellt werden. 

Im Cartoon- oder Animationsfilm stützen sich auf der Bild- und Ton- 
spur zwei virtuelle Realitäten, deren Künstlichkeit außerdem klar mar- 
kiert ist. Dazu gehört die Technik des Mickey-Mousing (> 46), wie diese 
Form der akustischen Zuschreibung allgemein genannt wird. Die Tonspu- 
ren von Cartoons favorisieren Rhythmus und Tempo. 

Das merkwürdige Phänomen, dass Zuschauer diese äußerste Form 
der Künstlichkeit überhaupt akzeptieren, hat ihre Wurzeln in der intermo- 
dalen Assoziation (> 137). Die Erfahrung lehrt uns, dass in der Mehrzahl 
der Fälle gleichzeitig auftretende visuelle und auditive Empfindungen zu 
einem Vorgang gehören. Diese Verbindung zwischen den verschiedenen 
Wahrnehmungsformen ist außerordentlich stark. Wie ich im Kapitel Ton/ 
Bild (> 141) dargestellt habe, werden in der magischen Welt des Klein- 
kindes symbolische Gegenstände im Spiel über Onomatopöen mit den 
entsprechenden Klangobjekten vertont: eine Streichholzschachtel, die ein 
Auto darstellt, mit einem Brummen. 

Im Lauf der Zeit hat die Cartoon-Tradition, vor allem die Produk- 
tionen von Warner Brothers und Walt Disney, ein eigenes Klanglexikon 
ausgebildet. Mit dieser Tradition hat sich Mark Mangini (1997) intensiv 
auseinandergesetzt, der als Supervising Sound Editor für die Tonspuren 
der neusten Disney-Produktionen wie THE Lion KinG (USA 1994, Roger 
Allers / Bob Minkoff) oder BEAUTY AND THE BEAST (USA 1991, Gary Trous- 
dale/ Kirk Wise) verantwortlich zeichnet. Mangini hat festgestellt, dass 
die Welt des Animationsfilms über ein eigenes, festgeschriebenes Vokabu- 
lar verfügt: 


Würde man zehn Leuten in einem dunklen Zimmer den Klang des Anlassers 
eines alten Propellerflugzeugs vorspielen, so könnte keiner von ihnen sagen, 
was das ist; aber ich wette, neun von ihnen würden behaupten, man höre 
den Tasmanischen Teufel, der sich wie wild dreht. Oder wenn man den Ton 
eines Fingers, der aus einer Flasche gezogen wird, viermal so schnell abspielt, 
werden sie sagen, das sei natürlich die leckende Zunge des Road Runners.” 
(Mangini in LoBrutto 1994: 276 f.) 


Der Einfluss der Cartoon-Ästhetik ist in den zeitgenössischen Tonspu- 
ren des Mainstreamfilms deutlich spürbar. Nicht nur Mangini äußert sich 


17 «You could put ten people in a dark room and play the sound of an inertia starter for an 
old prop plane and none of them could tell you what it is, but I bet nine of them would 
tell you it’s the sound for the Tasmanian Devil spinning wildly. Or play the sound of a 
finger popping out of a bottle four times fast, and they will all tell you that, of course, 
it’s the Road Runner’s tongue flipping.» 
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begeistert tiber die Innovationskraft von Tregoweth Brown, der die War- 
ner-Cartoons vertonte, und Jimmy MacDonald, der fiir Disney arbeitete. 

Eine ganze Generation von Regisseuren und Sound Designern ist 
unter dieser Tradition sozialisiert worden, die in den USA ausgepragter 
zum kulturellen Repertoire gehört als in Europa. Der Erfolg solcher abs- 
trakter Tonkreationen zeigte, dass ein durchschnittliches Massenpubli- 
kum die Assoziation von Bild und Ton auch dann problemlos bewältigte, 
wenn diese nur lose miteinander korrespondierten. Figuren wie die Robo- 
ter C3PO oder R2-D2 aus der STAR Wars-Trilogie, später auch E. T. — THE 
EXTRATERRESTRIAL (USA 1982, Steven Spielberg) oder der TERMINATOR, 
rekurrieren zumindest implizit auf diese Formensprache. 

Die Sprache von R2-D2 ist eine Variation von Rhythmus und Ton- 
höhe in der Tradition nicht referenzieller Sprachproduktion des Anima- 
tionsfilms. Burtt (in LoBrutto 1994: 144 f.) hatte zunächst rein elektronische 
Klänge verwendet, die ihm dann aber zu maschinenähnlich erschienen. 
Erst im Verlauf des Experimentierens kam er auf die Idee, R2-D2 als klei- 
nes Kind zu verstehen, das noch nicht gelernt hat zu sprechen, sondern 
nur mit bedeutungslosen Silben eine Sprachmelodie imitiert. Auf dieser 
Basis hat Burtt ein Archiv von R2-Phonemen aus menschlichen Lautimita- 
tionen, kombiniert mit elektronischen Sounds, aufgebaut, die er von Hand 
zu einzelnen Phrasen zusammenmontierte. 

Die Annahme eines wesentlichen Einflusses des Animationsfilms 
auf die zeitgenössische Film- und Tonästhetik stützt sich nicht nur auf die 
Aussagen ihrer Exponenten, sondern auch auf die stilistische Analyse des 
Korpus. Frühe Beispiele dafür sind die Komödien It’s 4 Map, MAD, MAD, 
Map Wor tp (USA 1962, Stanley Kramer) und Blake Edwards’ THE GREAT 
RAcE (USA 1964), dessen Tonspur von Tregoweth Brown kreiert wurde. 
Beide Komödien arbeiten mit einer comichaften, ins Groteske überspann- 
ten Form von Humor mit Schepperorgien, überdimensionierten Zusam- 
menstößen und Explosionen. Das stilistische Merkmal der offensichtli- 
chen Übertreibung hat eine distanzierende, ironisierende Funktion, die 
sich beispielsweise schon in den 1960er-Jahren in den Italowestern findet 
und seit den 1970er-Jahren mehr und mehr auch als genrefremdes Ele- 
ment in anderen actiongeladenen Genres anzutreffen ist, unter anderem 
in der Zeichnung der Roboter in STAR Wars. Wenn in Jaws (USA 1975, 
Steven Spielberg) Chief Brody und der Wissenschaftler Hooper nachts 
einen Hai aufschneiden, so kommen statt der erwarteten und gefürch- 
teten Leichenteile eine Menge kleinere Fische und ein paar Blechteile 
zum Vorschein, die in Slapstick-Manier scheppernd auf den Boden rol- 
len. Dieses augenzwinkernde Spiel mit der Erwartung des Zuschauers 
ist in der INDIANA JoNEs-Trilogie in einer Reihe völlig überdrehter Ton- 
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einfälle praktisch ständig präsent. Selbst das würgende Geräusch eines 
halb verwesten Schädels, den Indiana Jones im Prolog zu RAIDERS OF THE 
Lost Ark (USA 1981, Steven Spielberg) auf der Suche nach einem Schatz 
der Maya berührt, wirkt in seiner hyperrealistischen Ausarbeitung eher 
komisch als ekelerregend. Und auch die Cyborg-Hundefutter-Kombina- 
tion aus TERMINATOR 2 karikiert subtil die übermenschlichen Fähigkeiten 
des Cyborgs. 

Auf einer zweiten Ebene, welche der referenziellen Beziehung des 
Tons zum dargestellten Gegenstand überlagert ist, transportiert die Über- 
zeichnung einen Kommentar, wie er in Cartoons in plump metaphorischer 
Weise auftaucht: «Wenn eine Figur in einem Trickfilm vor Wut <kochte> 
oder so hart auf den Schädel geschlagen wurde, dass sie die «Vögel zwit- 
schern> hörte, so bekam das Publikum buchstäblich diese Geräusche ser- 
viert» (Mott 1989: 83).' Dieser Kommentar weist auf den Spielcharakter 
der Fiktion hin. In den Slapstick-Filmen waren es die überzeichneten 
Klangobjekte, welche den komischen Aspekt der Gewaltdarstellung trans- 
portierten, wenn Schläge auf den menschlichen Körper metallisch hohl 
klangen. Die von vielen Theoretikern (Chion 1985 und 1990, Jullier 1995, 
Gerstenkorn 1995) hochgelobten Tonspuren von Jacques Tati entfalten 
ihren Witz mit solchen Stilisierungen, die man mit etwas Mut im weiteren 
Sinn als brechtsche Verfremdungen bezeichnen könnte: 


Einen Vorgang oder einen Charakter verfremden heißt zunächst einfach, dem 
Vorgang oder dem Charakter das Selbstverständliche, Bekannte, Einleuch- 
tende zu nehmen und über ihn Staunen und Neugierde zu erzeugen. 

(Brecht 1964, III, 109) 


Es schwingt darin jenes Moment von Differenzqualität zur bloßen ikoni- 
schen Repräsentation mit, das die Autoren des Manifests als kontrapunk- 
tisch, René Clair als asynchron bezeichnet hat. 


Techniken 


Bei der Erforschung der Verfremdung und ihrer Techniken ist man mehr- 
heitlich auf die Aussage von Zeitzeugen angewiesen. Das gilt besonders 
für die Neuzeit, wo die Eingriffe in die klangliche Materie so raffiniert 
sind, dass sie auch dem geschulten Ohr verborgen bleiben. 

Eine der frühesten und weitverbreitetsten Techniken ist die Hüll- 
kurvenmanipulation (> Hüllkurve 227). Mott (1989: 12, 67) berichtet, wie 


18 «When a character in a cartoon became «boiling mad or was hit on the head hard 
enough to hear «birds singing, this is what the audience heard.» 
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er aus einem Geräusch namens Mogambi-Wasserfall mit einfachsten Mit- 
teln sowohl eine Explosion als auch eine Druckerpresse herstellte. Für die 
Explosion verlangsamte er die Plattenaufnahme von 78rpm auf 33rpm 
und simulierte mit dem Lautstärkeregler einen steilflankigen Einschwing- 
sowie einen langsamen Ausklingvorgang. Für die Druckerpresse rhythmi- 
sierte er den Wasserfall ebenfalls lediglich durch entsprechende Reglerbe- 
wegungen. 

Ebenfalls zu den Hüllkurvenmodulationen gehören Verlangsamung, 
Beschleunigung und Umkehrung, die bis heute üblich sind, jedoch auf 
den Workstations nicht mehr analog, sondern nur noch digital ausgeführt 
werden. Im Kapitel Abbildung (> 94) habe ich beschrieben, wie Beggs mit 
einer solchen Transformation aus industriellen Metallscheren ein Atemge- 
räusch hergestellt hat. 

Frank Warner, eine der herausragenden Figuren des Sound Design, 
der unter anderem für die spektakulären Tonspuren von CLOsE ENCOUN- 
TERS OF THE THIRD KIND (USA 1977, Steven Spielberg) und RAGING BULL 
(USA 1980, Martin Scorsese) verantwortlich war, hat fast ausschließlich 
mit solchen sehr einfachen Techniken gearbeitet. Warner hatte Ende der 
1950er-Jahre im Zuge der Zusammenarbeit mit Stanley Kubrick bei SPAR- 
TACUS (USA 1959) begriffen, dass die Tonspur als eigenständiges Element 
verstanden werden kann, das die Filmerfahrung erweitert. Eine weitere 
Inspirationsquelle waren für ihn die Filme von Jacques Tati mit ihrer 
abstrakt-stilisierten Tonästhetik. Warner gehört somit zu den frühesten 
Exponenten einer schöpferischen Auffassung der Tonkreation. 

Martin Scorsese soll zu ihm gesagt haben: «Du wirst mein Sympho- 
nieorchester sein. Du wirst die Musik und den Rhythmus dieses Films» 
[RAGING BULL] mit Geräuschen schaffen» (Hall in Brouwer 1990: 452). 

Warner hat verfremdete Klangobjekte hergestellt, indem er die 
Geschwindigkeit der Originalaufnahme auf %4-Zoll-Magnetband von 
Hand veränderte und auf Perfoband überspielte. 


Wenn man das Band von Hand steuert, kann man nicht alles genau so kon- 

trollieren wie mit einem elektrischen Steuergerät. Dadurch kann eine kleine 

Ungenauigkeit der Hand durch Zufall etwas Wunderbares bewirken.” 
(Warner in LoBrutto 1994: 29) 


Was Warner beschreibt, ist ein sehr intuitiver Umgang mit der Schönheit 
des Zufalls, die über jenes magische Moment verfügt, das sich kaum syn- 


19 «You will be my symphony. You will create the music and the rhythm of this film with 
sound effects.» 

20 «In doing it by hand you can’t control something precisely like you can with a variable 
electrical control. So a slip of my hand could be magic that just happened.» 
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thetisch konstruieren lässt. Es ist eben jenes Moment von Authentizität, 
das auch in Lucas’ Konzept der used future enthalten ist. Die Kunst liegt 
darin, dieses Moment in einem schier unüberschaubaren Angebot von 
möglichen Klangobjekten zu erkennen. In diesem Prozess kommt die 
Fähigkeit zum abstrakten Hören (> écoute reduite 276) zur Anwendung, 
die einen Audiophilen vom gewöhnlichen Fußvolk unterscheidet. Diese 
Mischung aus Intuition und Planung, die immer auch der Überraschung 
Raum lässt, findet sich in jeder kreativen Arbeit am Sound Design. 

Die Klangsubstitution, die sowohl in der Arbeit des Geräusche- 
machers vorherrscht als auch die wichtigste Technik zur virtuellen Klang- 
erzeugung darstellt, nutzt immer diesen experimentellen Freiraum. Wenn 
Sound Designer Gemüse zerhacken - was Anderson (in LoBrutto 1994: 
164) als fun with vegetables bezeichnet -, wenn sie auf Steaks schlagen, 
verschiedene Objekte abfackeln, Mikrofone in Präservative verpackt in 
den Schlamm stecken, so ist das immer ein experimentelles Erkunden 
des Materials und seiner unerforschten klanglichen Möglichkeiten. Dazu 
gehört auch die ungewöhnliche Kombination von Trockeneis auf Eisen, 
das einen schrecklich schrillen Klang mit Schreiqualität erzeugt.” 

Warner erzählt beispielsweise, wie er tagelang nach den passenden 
Klängen für die berühmten Schrauben suchte, die sich bei der Entführung 
des Jungen in CLOSE ENCOUNTERS OF THE THIRD KIND (USA 1977, Steven 
Spielberg) wie von Geisterhand geführt aus dem Boden lösen: 


Mein erster Gedanke war: «Werde groß!» Deshalb haben wir eine Platte auf 
den Boden gelegt und eine Saite an einem Nagel befestigt. Ich ging einfach 
[mit der Saite in der Hand] darum herum und schuf damit einen größeren 
Umfang, der das Geräusch richtig groß werden ließ [...].” 

(Warner in LoBrutto 1994: 33) 


Die Verfremdung hat die Funktion, den emotionalen Impakt einer Situ- 
ation zu repräsentieren, das Element des Gefährlichen und Übernatürli- 
chen, das gerade in einem solchen, eigentlich lächerlich bescheidenen Bild 
fehlt. Die Tonspur muss sozusagen den Zuschauer an die Hand nehmen 
und ihn von der offensichtlichen Manipulation wegführen in ein Reich 
der fantastischen Imagination. Diese Aufgabe zu bewältigen, ist eine Grat- 
wanderung auf brüchigem Terrain, denn es gilt, das Übernatürliche zu 


21 Viele Schilderungen solcher Verfahren der Klangsubstitution finden sich in LoBrutto 
(1994); ein ganzes Arsenal von klassischen Techniken listet Alten (1994) unter dem Titel 
Manually Produced Sound Effects (1994: 605 ff.) auf; weitere Quellen: Mott (1989), For- 
lenza et al. (1993). 

22 «The first thing that came into my mind was, «Get big!» So we put a board down on the 
floor, and I put a string on a nail. [...] Ijust went around making a bigger circumference 
out of it, going real big with it [...].» 
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suggerieren, ohne die Glaubwürdigkeit der Fiktion zu gefährden. Eine der 
wichtigsten Voraussetzungen dazu ist die genaue Kenntnis der hypotheti- 
schen Erwartungshaltung der Rezipienten. Sie ist von einem größeren kul- 
turellen Kontext geprägt, insbesondere von der intertextuellen Tradition 
bestimmter Genres, die mit ähnlichen Situationen arbeiten. 

Zur Zeit des Umbruchs in den 1970er-Jahren bestand eine Situation 
von unglaublicher Freiheit, weil neue Inhalte und Erzählformen ein neues 
klangliches Vokabularerforderten. Die Erwartungshaltungen des Publi- 
kums waren deshalb nicht ausschließlich von stereotypisierten Lösungen 
in früheren Werken geprägt, sondern die Kreationen der Tonspur mussten 
zur Erhaltung der Glaubwürdigkeit einige Mechanismen der Alltagswahr- 
nehmung berücksichtigen. 

Es ist eine der Hauptthesen dieser Arbeit, dass die materielle Beschaf- 
fenheit der Objekte eines der wichtigsten Bindeglieder zwischen der opti- 
schen und akustischen Repräsentation der Diegese darstellt. Dieser Ansatz 
wird hauptsächlich im Kapitel Material (> 330) ausgebaut. Ein glaubwür- 
diges Klangobjekt muss deshalb die tägliche Erfahrung der Zuschauer 
mit den diversen Materialien sowie mit Masse und Ausdehnung von 
Objekten berücksichtigen. Der emotionale Appell resultiert dann aus der 
bewusst angelegten Spannung zwischen natürlicher Darstellung und der 
Entfernung davon, die sich in der künstlichen Verfremdung manifestiert. 
Bezogen auf Warners Beispiel der Schrauben aus CLOsE ENCOUNTERS: Die 
materielle Verbindung zwischen Bild und Ion - das Metall - bleibt erhal- 
ten, während sich die Masse ändert, sie wird durch einen Resonanzkör- 
per ausgedehnt. Diese Ausdehnung der Masse verdeutlicht einerseits die 
physische Präsenz eines Objekts und bringt gleichzeitig eine suggestiv- 
wirksame Verlagerung des Klangobjekts in den Bassbereich (> Bässe 208) 
mit sich. Die Verlangsamung von Originalaufnahmen zur Ausdehnung 
von Masse und Volumen oder auch zur Erzeugung von unbestimmba- 
ren bassigen Effekten ist eine der häufigsten Formen akustischer Mani- 
pulation. 

Zu den klassischen Verfahren der Verfremdung gehört das analy- 
tische Zerlegen von komplexen Klangobjekten in die einzelnen akusti- 
schen Komponenten. Das Geräusch eines Kaminfeuers beispielsweise 
besteht - wie früher erwähnt (> 205) aus einem dumpfen Flackern, einem 
mittigen Brodeln und zwei hochfrequenten Anteilen: dem Zischen und 
dem Knistern. Diese Komponenten werden getrennt voneinander her- 
gestellt, parallel montiert und in der Endmischung wieder zusammen- 
geführt. 

Ein prominentes Beispiel dieser Technik sind die Hubschraubervaria- 
tionen aus ArocALYPsE Now (USA 1979, Francis Ford Coppola). Richard 


Isotopie 289 


Beggs stellte die Teilkomponenten des Hubschraubergeräuschs - das 
Schlagen der Rotorblatter, das hochfrequente Heulen der Turbinen und 
das Motorengeräusch von brummend bis rauschend - auf dem Synthe- 
sizer her. Kombiniert mit realen Aufnahmen konnte auf diese Weise eine 
beeindruckende Vielfalt von Hubschraubertönen zusammengetragen 
werden, die sowohl erdrückend authentisch — wie im berühmten Walkü- 
renritt-Angriff auf das vietnamesische Dorf — oder ätherisch-surreal wie in 
der Eröffnungsszene” wirken können. Für die weitere Diskussion ist die- 
ser Einblick von einiger Bedeutung, manifestiert sich doch darin, dass ein 
einzelnes objektbezogenes Perzept - sprachlich als Hubschrauber bezeich- 
net-in unendlich vielen akustischen Variationen dargestellt werden kann. 


Isotopie 


Musikalisierung der Tonspur - so hatte ich postuliert - bedeutet Organisa- 
tion der Klangobjekte nach Gesichtspunkten nicht nur der semantischen, 
sondern auch der sensorischen Dimension. Dabei werden die klanglichen 
Eigenschaften des Reizes selbst in Beziehung zueinander gesetzt. Neu- 
ere Publikationen, die sich mit der kognitiven Verarbeitung des Films 
beschäftigen, messen der assoziativen Verknüpfung von perzeptiven 
Komponenten bei der Rezeption zunehmend größeren Stellenwert zu. 
Zu nennen wäre insbesondere die bereits erwähnte Publikation von Wuss 
(1993), der ein Modell entworfen hat, in dem er die Prozessierung der 
Reizdimension neben der konzept- und der stereotypengeleiteten Infor- 
mationsverarbeitung als eine der drei Grundformen filmischer Wahrneh- 
mung betrachtet. Weiter wäre Grodal (1994) zu nennen, der dem Aspekt 
assoziativer Strukturen ebenfalls einen höheren Stellenwert einräumt und 
Bordwells Verständnis der filmischen Kommunikation als grundlegend 
bedeutungsorientiertes Phänomen (Bordwell 1985, 1991) kritisch bewer- 
tet, weil es seiner Auffassung nach der sensorischen Dimension zu wenig 
Raum lässt. 

In der Theorie des Hörens wird der mentalen Strukturbildung auf- 
grund sensorischer Dimensionen deshalb besondere Bedeutsamkeit ein- 
geräumt, weil die klanglichen Qualitäten das Rohmaterial sind, aus dem 
die musikalische Komposition entsteht. Besonders Meyer (1956) befasst 
sich mit dem Zusammenhang zwischen Struktur, Emotion und Sinn in 
der Musik auf einem gestaltpsychologischen Fundament, dessen Grund- 


23 Diese Szene werde ich unter dem Aspekt der Subjektivierung genau analysieren 
(> 383).# 
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züge ich an anderer Stelle thematisiert habe. Die Gesetzmäßigkeiten von 
Aufmerksamkeit und Selektion (> 244) und des Streaming (> 253) bilden 
die wichtigste Grundlage zum Verständnis der auditiven Informationsver- 
arbeitung. 

Zur Hauptsache stütze ich mich bei der folgenden Darstellung auf 
Wuss (1993), werde aber zusätzlich meine Überlegungen zum auditiven 
Streaming beiziehen. Denn Wuss blendet zwar den akustischen Aspekt 
nicht explizit aus seiner Analyse aus, bezieht seine Beispiele jedoch aus- 
schließlich aus der visuellen Strukturbildung, die sich in einigen nicht 
unbedeutenden Punkten davon unterscheidet. 

Unter perzeptionsgeleiteten Strukturen versteht Wuss (1993) zunächst 
ganz global Serien ähnlicher Reizkonfigurationen. Solche Serien lassen 
sich bereits auf den Tonspuren einiger früher Filme finden, in erster Linie 
Serien von Signallauten, die nicht nur hinsichtlich ihrer Bedeutung, son- 
dern auch hinsichtlich ihrer morphologischen Gestalt miteinander kor- 
respondieren. Besonders der Klangraum Stadt wurde über solche Serien 
dargestellt, unter anderem in BLACKMAIL (GB 1929, Alfred Hitchcock), in 
THE Bic House (USA 1930, George Hill) und in Kıng Kong (USA 1933, 
Cooper/Schoedsack). 

Eine sehr bemerkenswerte Strukturbildung durch Serialisierung 
einer Reizkonfiguration findet sich beispielsweise in THE Bic House 
(0.29.18-0.34.12). Butch, der Protagonist, rebelliert gegen das Essen und 
löst damit einen kollektiven Aufstand aus, der später zur Meuterei eska- 
liert. Folgende Elemente prägen die Struktur: 


° Trillerpfeife 

e Stille 

° Trillerpfeife 

° Wenden von Hunderten von Tassen synchron 
° Trillerpfeife 

° Wenden von Hunderten von Tellern synchron 
e Schritte klackend auf Holz 

e Klappern von Tellern 

e° Scheppern eines Blechtellers 

e Klopfen von Hunderten von Blechtellern nah 

e° Klopfen von Hunderten von Blechtellern total 
e Schritte klackend auf Stein 

e Stille 

e Schritte schleifend leise 

° Trillerpfeife 

° Trillerpfeife 
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Hauptsächlich die Klangobjekte Trillerpfeife — semantisch als Signallaut 
und gleichzeitig als stereotypisierter Orientierungslaut (> 305) zu klas- 
sifizieren — und das Klappern des Geschirrs als handlungsbegleitende 
Geräusche werden an einer deutlich wahrnehmbaren Struktur ausge- 
richtet. Während die Geschirrgeräusche über Variationen modifiziert 
werden, bleibt die Trillerpfeife stabil. Über ihren semantischen Gehalt 
hinaus hat sie die Funktion, den Klangfluss zu segmentieren. Die Klang- 
objekte, die vom Geschirr erzeugt werden, wirken über verschiedene 
kontinuierliche Veränderungen als Motor einer zunehmenden Intensi- 
vierung. Wesentliches Element der intensivierenden Modifikation ist der 
Teilaspekt Rhythmus, dem das Klangobjekt unterworfen ist, von einem 
einzelnen perkussiven Laut, der über eine synchrone Handlung ausge- 
löst wird, über ein amorphes Klappern zu regelmäßig rhythmisiertem 
Klopfen. 

Eine ähnliche Struktur findet sich in DELICATESSEN (Frankreich 1990, 
Jean-Pierre Jeunet / Marc Caro, 0.14.02-0.16.33), wenn eine Bettszene zwi- 
schen dem Fleischermeister und seiner Geliebten zum rhythmischen Zen- 
trum einer Reihe von breitgestreuten Aktivitäten innerhalb des Hauses 
wird. Die Klangobjekte 


e° Deckestreichen 

e Knarren der Bettfedern 
e Celloüben 

° dumpfer Schlag 

° Teppichklopfen 

e Pumpen 

e Metronom 

e Deckestreichen 

e Bohren 

e Stimmgabelsummen 
e Blöken 

e Cello staccato 

e Schrei 

e Platzen des Pneus 


ordnen sich einer gemeinsamen rhythmischen Struktur unter, welche 
von der sexuellen Aktivität des Fleischers ausgeht und mit zunehmen- 
der Beschleunigung dem Höhepunkt - akustisch markiert als Assoziation 
Schrei — Platzen des Pneus — zustrebt. Dieser Vorgang formiert sich auf einer 
höheren Ebene zu einem komplexen Superzeichen, das einen Zusammen- 
hang zwischen Reizstruktur und semantischer Geste herstellt. Der Flei- 
scher in DELICATESSEN ist nicht nur in dieser Szene, sondern im ganzen 
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Film der Taktgeber des Hauses. Jeunet und Caro ist es allerdings in dieser 
Sequenz gelungen, diese Hierarchie in äußerst sinnfalliger Weise darzu- 
stellen. 

Die Beispiele aus THE Big House und DELICATESSEN sind didaktisch 
wertvoll, jedoch untypisch. Hier tritt ein Mechanismus an die Oberfläche 
des Diskurses, der sich normalerweise unauffällig in einer tieferen Schicht 
der narrativen Konstruktion bewegt. 

Der Begriff perzeptionsgeleitete Struktur, den Wuss für die Formierung 
assoziativer Superzeichen gewählt hat, ist innerhalb seines PKS genannten 
Modells (Perzeption, Konzept, Stereotyp) einleuchtend, da er eine bestimmte 
Schicht von anderen abgrenzt. Aus meiner Sicht muss der Begriff jedoch 
revidiert werden. Die Reihung perzeptiv ähnlicher Reizstrukturen ist nur 
ein Aspekt einer vorwiegend an der sensorischen Dimension ausgerich- 
teten Rezeption. Aspekte wie Klangfarbe, Material, Stille oder Lautstärke 
werden auch ohne Reihung hauptsächlich oder zumindest teilweise im 
perzeptiven Modus verarbeitet. Der Terminus lyrischer Modus, den Gro- 
dal (1994: 187) für sensorisch-assoziative Verknüpfungen vorschlägt, ist 
zwar sehr gefällig, erweckt aber aufgrund seiner gattungsbestimmenden 
Dimension den Eindruck, als handle es sich bei dieser Art der Strukturbil- 
dung um einen Zusammenhang von Form und Gattung. Dies ist gerade 
nicht der Fall. Besonders im Mainstreamfilm ist es das Merkmal der Rei- 
hung, dass sie nur zu einem geringen Teil zur Sinnbildung beiträgt. Im 
Gegensatz zu offenen Konstruktionen, in denen die assoziative Verknüp- 
fung von semantisch nur lose zusammenhängenden Teilen zur Hauptstra- 
tegie der Rezeption werden kann, ist die perzeptiv geleitete oder lyrische 
Schicht der Informationsverarbeitung im Mainstreamfilm nur ein fakulta- 
tiver Aspekt, der nicht unmittelbar zum Verständnis notwendig ist. Ähn- 
lich wie bei der Symbolik (> 163) handelt es sich um eine latente Schicht, 
deren Integration in die Rezeption von der kulturellen Disposition und 
Kompetenz des Rezipienten abhängt. Um dem terminologischen Dilemma 
zu entkommen, greife ich deshalb auf den Begriff Isotopie zurück. 

Greimas (1966: 69 ff.) fasst unter Isotopie verschiedene Formen der 
Reihung zusammen, die über folgende Merkmale verfügen: Die Elemente 
der Isotopie gehören zu einem kategorialen Verbund. In der Terminolo- 
gie von Greimas wird die Zuordnung zu einer Isotopie durch Klasseme 
bestimmt. Damit sind Merkmale gemeint, welche die Zugehörigkeit eines 
Objekts zu einer Klasse definieren und von einer anderen unterscheiden, 
zum Beispiel belebt versus unbelebt. 

Aufgrund der losen semantischen Verbindung handelt es sich bei der 
Isotopie um eine latente, mehrdeutige Struktur, die parallel zu einer mani- 
festen, eindeutigen Struktur angelegt ist. 
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Laut Eco (1987: 115 ff.) ist im Anschluss an Greimas die Isotopie zu 
einem Sammelbegriff verschiedener semiotischer Phanomene geworden, 
die generell als Kohärenz eines Lektüreablaufs zu definieren sind. Damit 
verlässt der Begriff Isotopie die semantische Eingrenzung zunehmend. Als 
Kohärenz stiftende Bindeglieder nennt Eco ausdrücklich auch klangliche 
Aspekte. Bezogen auf die Literatur, auf deren Interpretation er den Begriff 
anwendet, sind es klangliche Aspekte der Sprache, das heißt, phonetische 
und prosodische Merkmale. 

Das klangliche Arsenal, das für die Bildung von Isotopien auf der 
Tonspur infrage kommt, umfasst folgende bisher genannte Aspekte: 
Klangfarbe, Tonhöhe, Hüllkurve und Rhythmus. In den Parameter Klang- 
farbe ist besonders auch die materielle Grundlage der Klangproduktion 
einbezogen, welche im Kapitel Material (> 330) dargestellt wird. Weiter 
sind es morphologische Verwandtschaften wie vor allem der Doppleref- 
fekt, der sowohl die Hüllkurve als auch die Entwicklung der Tonhöhe in 
einer spezifischen Gestalt integriert. Alle diese Aspekte können über eine 
Reihung Kohärenz erzeugen und latent zur Bedeutungskonstitution bei 
der Rezeption beitragen. Von semantischen Kategorien lässt sich die Isoto- 
pie nicht ohne Weiteres trennen, wie vor allem Wuss bei der theoretischen 
Behandlung perzeptionsgeleiteter Strukturen postuliert. Selbst in den 
Beispielen, die er heranzieht, decken sich semantische und sensorische 
Dimensionen zumindest teilweise. Unter anderem nennt er die Eingangs- 
sequenz zu PROSPERO’S Books (GB 1991, Peter Greenaway), die auf einer 
thematischen, visuellen und akustischen Reihung von fließendem, trop- 
fendem und stehendem Wasser aufbaut. 

Eine Reihe von Phänomenen, die in dieser Arbeit bereits besprochen 
wurden, lassen sich unter dem Begriff Isotopie nochmals aus einer ande- 
ren Perspektive betrachten. Zunächst die Türen aus THE SILENCE OF THE 
Lames (USA 1990, Jonathan Demme), die im Kapitel Semantik erster Ord- 
nung (> 115) genauer unter die Lupe genommen werden. Die Häufigkeit, 
mit welcher Türen in diesem Film zu hören sind, ist so auffällig, dass diese 
Klangobjekte unter semantischen Gesichtspunkten eine suprasegmentale 
Struktur bilden, die außerdem über einen symbolisch motivierten Bedeu- 
tungsgehalt verfügen. Diese suprasegmentale Struktur zerfällt auf der 
klanglichen Ebene in einzelne, parallel laufende Isotopien. Zu nennen 
wären unter anderem die dumpf klackenden Metalltüren oder die quiet- 
schenden Türen. In Bezug auf die Metalltüren, die besonders in der bereits 
beschriebenen Szene (0.08.52-0.18.36) im Vordergrund stehen, in welcher 
Clarice Starling Dr. Lecter das erste Mal im Hochsicherheitstrakt besucht, 
hatte ich festgestellt, dass sie einem musikalisch anmutenden Komposi- 
tionsprinzip mit Thema und Variation unterworfen werden. Das Thema — 
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um diesen Gedanken fortzuspinnen — ware dann das Klangobjekt Metall- 
tür. Die einzelnen Realisierungen dieses Klangobjekts verbinden sich nicht 
nur auf einer semantischen Ebene, indem sie ein Objekt bezeichnen, das zu 
einem spezifischen semantischen Feld gehört, sondern auch in klanglicher 
Hinsicht. Die meisten akustischen Parameter bleiben stabil, unter anderem 
die groben Umrisse der Hüllkurve, die über einen langsamen Einschwing- 
vorgang, einen kaum wahrnehmbaren Körper und - bedingt durch den 
Hall — einen langsamen Ausschwingvorgang verfügt. Das Frequenzbün- 
del, das für die Tonhöhenwahrnehmung ausschlaggebend ist, liegt für das 
dumpfe Schließgeräusch bei rund 120 Hz, ist also eher bassig, die Klang- 
farbe dumpf. Das Sirren respektive Quietschen, das den langsamen Ein- 
schwingvorgang verursacht, dürfte bei 1000 bis 2000 Hz liegen. Als Varia- 
tionen sind die leichten Merkmalsverschiebungen zu verstehen, welche 
die einzelnen Klangobjekte voneinander unterscheiden. Tatsächlich han- 
delt es sich dabei nie um reine Wiederholung, sondern stets um eine diffe- 
renzierte Modifikation. Diese Tatsache ist für die perzeptive Verarbeitung 
erheblich. Während reine Wiederholung zu einer Habituation - umgangs- 
sprachlich auch Langeweile genannt — und damit zu einem perzeptiven 
Verblassen führt, nährt die leichte Variation den sensorischen Apparat mit 
immer neuen Reizkonfigurationen. 

Die Bildung von Isotopien ist eine typische Gestaltungsstrategie zeit- 
genössischen Sound Designs. Die verschiedenen Spielformen des Hub- 
schraubergeräuschs in APOCALYPSE Now (USA 1979, Francis Ford Cop- 
pola), die hier mehrfach unter diversen Oberbegriffen analysiert wurden, 
gehören dank der gezielten Wiederholung und Variation sensorischer 
Ausprägungen dazu. RUMBLE FısH (USA 1983, Francis Ford Coppola) 
baut nicht nur auf einem Geflecht von Bassvariationen auf, sondern the- 
matisiert auch das Motiv der Uhr in allen denkbaren akustischen Schat- 
tierungen von Grillenzirpen bis Wassertröpfeln, bildet mithin Isotopien 
auf der Basis von Rhythmus, die mit den Rhythmen von Stewart Cope- 
lands Musikkomposition auf raffinierteste Art und Weise interagieren. Die 
metallischen Geräusche von TERMINATOR 2 (USA 1991, James Cameron) 
sind ebenso serialisiert wie die Wasser- und Holzgeräusche in THE PIANO 
(Neuseeland 1993, Jane Campion), die Windgeräusche aus LAWRENCE 
OF ARABIA (GB/USA 1962, David Lean) und die Motoren in THELMA & 
Louise (USA 1991, Ridley Scott). 

Die analytische Bestimmung von Isotopien gehört zu den schwierige- 
ren Aufgaben der wissenschaftlichen Beschäftigung mit der Tonspur. Die 
Arbeit mit Studenten hat gezeigt, dass ein länger dauerndes Training der 
bewussten Hinwendung zu klanglichen Parametern nötig ist, bis die fei- 
nen latenten Strukturen erfasst werden können. Diese Schwierigkeit rührt 
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daher, dass die Rezipienten tiber keine Vorinformationen zu diesen Struk- 
turen verfiigen, sondern sie sich erst aneignen mtissen. «Die perzeptions- 
geleiteten Strukturen einer Filmkomposition, [...], sind wenig evident und 
werden vom Rezipienten relativ unbewusst aufgenommen, denn sie ent- 
sprechen einer frühen Integrations- bzw. Lernphase» (Wuss 1993: 60 f.).* 
Im Gegensatz zu Symbolen, Signallauten oder Stereotypen referieren Iso- 
topien auf keine vorfilmische oder intertextuelle Bedeutung. 

Verschiedene Isotopien bilden ein zentrales Thema in den Modell- 
analysen (— 414). 


24 Weiter schreibt Wuss (1993: 57): «Ein zeichenhafter Charakter der Strukturinvariante 
ist nur latent vorhanden und bildet sich erst nach und nach heraus. Dies geschieht, 
indem die anfangs recht unauffallige Reizkonfiguration tiber Repetition allmahlich 
auffalliger wird, ohne jedoch ihr Auffalligkeitsmaximum zu erreichen. Sie ist seman- 
tisch noch instabil, bleibt im Bereich des Vorbewussten, das durch irreversible Opera- 
tionen gekennzeichnet ist, und sie wird vermutlich nur während der unmittelbaren 
Vorführdauer eines Films im sogenannten Intermediär-, Zeit- oder Arbeitsgedächtnis 
des Zuschauers gespeichert, kann also kaum länger als zwei Stundenbehaltenwerden.» 


IV Narrative Funktionen 


10 Orientierung, Setting, Szenografie 


Die Schauplätze des Films und ihre geografische, kulturelle und soziale 
Situierung sind nicht nur fiktive Umwelten, in denen die Figuren existie- 
ren und handeln, sondern auch Bausteine des Erzählens. Eine endliche, 
in den allermeisten Fällen kleine Anzahl von Schauplätzen repräsentieren 
so etwas wie eine Tiefenstruktur. Indem sie sowohl innerhalb der einzel- 
nen Narration als auch innerhalb von Genres und noch größeren Verbän- 
den medialer Repräsentation, in der bildenden Kunst und der Literatur, 
immer wieder auftauchen, absorbieren sie mythische, archetypische und 
sinnliche Dimensionen. Wüste, Meer, Dschungel — um einige Beispiele mit 
besonders reicher Tradition zu nennen - können nicht nur Bühnen der 
Handlung, sondern auch Akteure mit weit verzweigter Bedeutung sein. 
Das Ausmaß, in welchem Filme ihren Schauplätzen Bedeutung zuordnen, 
variiert mit dem Genre und mit der psychischen Befindlichkeit der Pro- 
tagonisten. Dieses Ausmaß ist — so eine erste Hypothese, die zu belegen 
sein wird — ein Charakteristikum des Stils und zeitbedingter Modeströ- 
mungen. 

Eine Kardinalfunktion der Tonspur ist es, Kohärenz zu schaffen und 
die fragmentierten Ausschnitte aus der profilmischen Wirklichkeit in 
einem übergeordneten Ganzen zu verankern. Damit unterstützt die Ton- 
spur die Orientierung sowohl im raumzeitlichen Geflecht der Handlung 
als auch in den narrativen Strukturen wie Sequenzen, Szenen, Handlun- 
gen, Ereignissen. Die Klangobjekte auf der Tonspur entwerfen in der Inter- 
aktion mit dem Bildmaterial, dem Text und der Musik komplette Szeno- 
grafien. 

Standardisierte Strategien zur Exposition von Schauplätzen waren im 
Stummfilm die Zwischentitel und der Establishing Shot, eine Totale des 
Settings. Schriftliche Texte bleiben bis heute ein Mittel zur Bezeichnung 
von Orten und Zeiten. Als Titel, Inschriften, Schlagzeilen, auf Wegwei- 
sern, Briefen und Computerdisplays haben die Zwischentitel des Stumm- 
films überlebt. Vor allem in Genres, die sich auf eine historische Faktizität 
berufen, insbesondere in den Biopics, sind Titel überdurchschnittlich oft 
das erste Mittel zur Verankerung von Ort und Zeit. An diese fast schon 
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konventionalisierte Verbindung kniipfen aber auch Werke aus anderen 
Genres an mit dem Ziel, eine solche Faktizität zu behaupten, im Korpus 
unter anderem die INDIANA JONES-Irilogie, ORLANDO (GB 1992, Sally Pot- 
ter), TERMINATOR 2 (USA 1991, James Cameron), JuRAssic Park (USA 1993, 
Steven Spielberg) und THE SILENCE OF THE LAMBs (USA 1991, Jonathan 
Demme). Sprachliche Benennungen von Orten und Zeiten treten weiter 
in den Dialogen und speziell in den Voiceover-Erzählungen auf, also in 
inneren Monologen der Filmfiguren oder Kommentaren von unbeteiligten 
Beobachtern. 

Die Tonspur wurde seit ihrer Einführung als geeignetes Mittel zur 
Charakterisierung von Schauplätzen erachtet. Stellvertretend sei eine 
schöne Beschreibung dieser Funktion bei Baläzs zitiert: 


Der Tonfilm wird unsere akustische Umwelt entdecken. Die Stimmen der 
Dinge, die intime Sprache der Natur. Alles, was außerhalb des menschli- 
chen Dialogs noch mitspricht, noch zu uns spricht in der großen Lebenskon- 
versation und unser Denken und Fühlen ununterbrochen tief beeinflusst. 
Vom Brausen der Brandung, vom Getöse der Fabrik bis zur monotonen 
Melodie des Herbstregens an den dunklen Fensterscheiben und dem Knar- 
ren des Fußbodens in der einsamen Stube. Sensitive lyrische Dichter haben 
diese bedeutungsvollen Stimmen, die uns begleiten, oft beschrieben. Der 
Tonfilm wird sie darstellen, er wird sie wieder ertönen lassen. 

(Balazs 1930: 152) 


Baläzs stellt ein Grundcharakteristikum des Hörens ins Zentrum seiner 
Überlegung: die Präsenz der Umwelt als ununterbrochener akustischer 
Datenstrom. Über das Ohr stehen wir in einem ständigen Dialog mit dem 
Raum, der uns umgibt. Seine Größe und Materialität beeinflussen direkt 
die Klangentfaltung. Die gepolsterte, flüsterleise Ambiance einer Hotel- 
rezeption bewirkt ein anderes Empfinden als die großräumige Hallig- 
keit sakraler Bauten. Die räumliche Dimension des Klangs, die häufig als 
Atmosphäre eines Raums beschrieben wird, haben wir so stark verinner- 
licht, dass wir auf das Auseinanderklaffen von visueller und auditiver 
Raumwahrnehmung panisch reagieren: Die absolute Stille im schalltoten 
Versuchslabor, einem Raum, der auf unsere Präsenz nicht antwortet, also 
keine Resonanz entwickelt, ist ein Erlebnis, das mit den Schemata aus der 
Erfahrung nicht in Einklang zu bringen ist. Gehöreindrücke katapultieren 
uns — wie Gerüche - noch nach Jahren unvermittelt in frühere Erlebnisse 
zurück. Sie evozieren innere Bilder; ganze Landschaften tauchen vor dem 
inneren Auge auf, längst vergessene Empfindungen werden wieder wach. 
Jeder Ort prägt sich als akustisches Bündel von spezifischen Klangobjek- 
ten ein. 
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Welche Informationen die Tonspur zur Charakterisierung von Schau- 
plätzen und Zeiten zur Verfügung stellt, welche Strategien sie in Abhän- 
gigkeit von zeit- und genrebedingten Strömungen dabei einschlägt und 
nicht zuletzt, wie man diese Parameter analysieren kann, werde ich im 
Folgenden thematisieren. 


Physikalische Aspekte der akustischen 
Raumrepräsentation 


Die akustische Darstellung des architektonischen Raums unterliegt einer 
Reihe von physikalischen Gesetzmäßigkeiten, die sehr gut untersucht 
sind. Ich beschränke mich bei der folgenden Darstellung auf die wichtigs- 
ten Parameter der Schallausbreitung im Raum." 

Die Schallwelle wandelt aufgrund ihres Ausbreitungs- und Refle- 
xionsverhaltens Raum in Zeit. Strahlt eine Quelle allseitig einen Schallim- 
puls ab, so wird dieser von den Begrenzungsflächen und von den Gegen- 
ständen im Raum in Abhängigkeit vom Material und von der Materialform 
reflektiert oder absorbiert, gebeugt, gestreut oder gebündelt (Abb. 47). 


Material Oktav-Mittenfrequenz (Hz) 

125 250 500 1000 2000 4000 
Beton 0,02 0,02 0,02 0,02 0,03 0,03 
Mauerwerk, Putz 0,03 0,03 0,03 0,04 0,05 0,06 
HolzfuBboden 0,15 0,11 0,10 0,07 0,06 0,06 
Linoleumbelag 0,02 0,03 0,03 0,04 0,06 0,05 
Teppich 0,01 0,02 0,04 0,15 0,36 0,32 
Plüschvorhänge 0,15 0,45 0,96 0,91 1,06 1,02 
Absorber 0,30 0,69 1,01 0,81 0,66 0,62 
mäßig gepolstertes 
Gestühl 
a) unbesetzt 0,44 0,56 0,67 0,74 0,83 0,87 
b) besetzt 0,55 0,86 0,83 0,87 0,90 0,87 


47 Frequenzabhängige Absorption diverser Materialien 


1 Literaturempfehlung zum Thema: Michael Dickreiter und Schule fiir Rundfunktech- 
nik: Handbuch der Tonstudiotechnik (München: Saur, 1987-1990); etwas einfacher und 
anschaulicher: Stanley R. Alten: Audio in Media (1994). 
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Unter Reflexion versteht man eine Richtungsänderung sämtlicher Fre- 
quenzanteile, das bedeutet, dass ausschließlich der frequenzabhängige 
Absorptionsgrad des Materials einen Einfluss auf die klangliche Verän- 
derung hat (siehe Abb. 47). Beugung bedeutet eine Richtungsänderung in 
Abhängigkeit von der Frequenz, die dadurch zustande kommt, dass sich 
Schallwellen je nach Wellenlänge um Gegenstände herumbewegen oder 
von ihnen reflektiert werden. Im Allgemeinen werden höhere Frequenzen 
mit ihrer kurzen Wellenlänge eher reflektiert als tiefe, mit der Konsequenz, 
dass sich durch Schallbeugung die Zusammensetzung des Schalls und 
damit auch seine Klangfarbe verändert. 

Grundsätzlich kann man zwei Parameter der akustischen Raum- 
information unterscheiden: die Verzögerung und die Nachhallzeit. Die 
Differenz, die zwischen dem Eintreffen des direkten Schalls und der ers- 
ten Reflexion besteht, wird als Verzögerung (delay) bezeichnet. Sie steht in 
direkter Beziehung zur Empfindung der Raumgröße: Ein Raum erscheint 
umso größer, je stärker die erste Reflexion verzögert ist. Für große Säle 
liegt sie beispielsweise im Bereich von 30 bis 50 ms. Wird der kritische Wert 
von 50 ms überschritten, empfinden wir den verzögerten Schall bereits 
als Echo. Als Nachhallzeit wird der Zeitraum definiert, «in welchem nach 
Abschalten der Schallquelle die Schallenergie auf den millionsten Teil und 
der Schalldruckpegel um 60 dB absinkt» (Dickreiter 1979: 29), also nicht 
mehr zu hören ist. 

Die Nachhallzeit steht in Beziehung zum Raumvolumen, zur Größe 
der Wandflächen und zur Schallabsorption. Winckel (1960: 55 ff.) weist 
auch darauf hin, dass die architektonische Ausgestaltung des Raumes zur 
gleichmäßigen Schalldiffusion sehr wichtig ist. Barock- und neoklassizis- 
tische Bauten entwickeln dank ihrer reichen Ausgestaltung mit Säulen, 
Skulpturen und kassettierten Decken eine optimale Schalldiffusion für 
komplexe polyfone Werke, während sich gotische Kathedralen mit einer 
Nachhallzeit von bis zu sieben Sekunden speziell für den homofonen gre- 
gorianischen Choral eignen. 

Die Rauminformation ergibt sich aus der Kombination von Verzö- 
gerung, Nachhallzeit und den spezifischen Klangverfärbungen durch die 
Materialisierung von Wänden, Böden und Decken. Die Information für 
einen spezifischen Raum entsteht aus dem Zusammenspiel der verschie- 
denen Indikatoren. Ein kleines Bad mit gekachelten Wänden mag zwar 
eine im Vergleich zum Raumvolumen lange Nachhallzeit haben, die Ver- 
zögerung wird jedoch sehr kurz sein. Eine leere Lagerhalle klingt bei glei- 
cher Nachhallzeit anders als eine Kirche oder ein Konzertsaal. 

Sprache besteht im Vergleich zur Musik aus sehr kurzen distinkten 
Lauteinheiten, den Phonemen. Deshalb leidet die Sprachverständlichkeit 
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unter der Zumischung von diffusem Hall. Dieser Faktor war aus techni- 
scher Hinsicht ausschlaggebend fiir die Beseitigung der Tonperspektive in 
der Sprachaufnahme des frühen Tonfilms. Die Distanz des Mikrofons zur 
Schallquelle bestimmt nämlich in hohem Maß das Verhältnis von direk- 
tem zu diffusem Schall und damit die Sprachverständlichkeit. Sprech- 
theater haben deshalb eine transparentere Akustik als Opernhäuser oder 
Konzertsäle. 

Die Raumsimulatoren, die Ende der 1970er-Jahre auf den Markt 
kamen, konnten die Klangobjekte mit sämtlichen Parametern der akusti- 
schen Raumrepräsentation nachträglich exakt in einem genau definierten 
fiktiven Raum platzieren (> Hall 59). 


Terminologie 


Die Geräusche lenken den Blick in die Tiefen des Bildes, die Töne moti- 
vieren Kamerabewegungen oder repräsentieren jene Teile des Raums, die 
nicht zu sehen sind. 

Terminologisch war dieser Bereich lange nicht erschlossen, die klas- 
sische Terminologie - unter anderem vertreten durch Gorbman (1987) 
und Bordwell/ Thompson (1979) — geht zunächst vom Begriff Diegese 
aus. Als Diegese wird das raumzeitliche Kontinuum bezeichnet, in dem 
sich die fiktionale Handlung entwickelt. Als diegetisch bezeichnet man 
einen Ton, wenn seine Quelle — Objekt oder Filmfigur - zur Diegese 
gehört. Extra- oder nondiegetisch sind Töne dann, wenn sie von Quel- 
len außerhalb der Diegese stammen. In diese Kategorie fällt ein großer 
Teil der Filmmusik sowie der gesprochene Kommentar einer Erzähler- 
stimme (Voiceover), während man nur wenige Geräusche dieser Kate- 
gorie zuordnen kann. Bordwell/Thompson weisen darauf hin, dass die 
Grenzen zwischen diesen Unterscheidungen nicht immer eindeutig sind. 
Zum Beispiel sind Szenen denkbar, in denen Figuren auf nondiegetische 
Töne reagieren. 

Diegetische Töne unterteilen Bordwell/Thompson wiederum in on- 
und off-Töne in Abhängigkeit davon, ob ihre Quelle im Bild erscheint (on) 
oder außerhalb des Bildrahmens zu vermuten ist (off). Diese Unterschei- 
dung wird zu Recht kritisiert, unter anderem von Türschmann (1994) und 
Jullier (1995). Chion (1990) selbst, der in seiner vorgängigen Publikation 
Le Son au cinema (1985) in den Grundzügen ein solches Modell vorgestellt 
hatte, distanziert sich heute von dieser Unterscheidung. 

Die Problematik rührt von einer Grundeigenschaft akustischer Ereig- 
nisse: Sie sind invasiv und ubiquitär, sie durchdringen Mauern und gehen 
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um Ecken. In vielen Fallen lasst sich nicht entscheiden, ob die Klangob- 
jekte ihre Quelle im Bild haben oder nicht. Mehr noch, diegetische Klang- 
objekte befinden sich auch dann im abgebildeten Raum, wenn ihre Quel- 
len außerhalb des Bildes situiert sind, insofern als die Figuren sie ebenfalls 
hören können. Mit anderen Worten: Der Off-Ton ist ein weites Feld. 
Chion schlägt deshalb zunächst folgende Unterscheidungen vor: 


Unter aktivem Off-Ton versteht man jene Formen, die Fragen aufwerfen (Was 
hört man? Was geschieht?), die eine Reaktion im Bild hervorrufen und zum 
Suchen auffordern. Der Ton schafft also Aufmerksamkeit und Neugierde, 
die den Film vorantreiben und die Antizipation des Zuschauers nähren («Ich 
würde gerne sein Gesicht sehen, wenn der andere mit ihm spricht»). Der ak- 
tive Off-Ton besteht grundsätzlich aus Tönen, deren Quelle punktförmig ist, 
die mit anderen Worten klar lokalisierbaren Objekten zugeordnet ist. In der 
traditionellen Ton-Bild-Montage wird er oft eingesetzt, indem man Objekte 
oder Figuren über den Ton einführt und sie erst dann zeigt (Überlappung). 
Gewisse Film wie PsycHo (USA 1960, Alfred Hitchcock) bauen ganz auf die 
Neugierde auf, die über den aktiven Off-Ton geschaffen wird: Wie sieht diese 
Mutter aus, die man ständig hört?? (Chion 1990: 75) 


Wichtig am aktiven Off-Ton ist weiter, dass er ein Element der Handlung 
bildet und dass die Figuren auf ihn reagieren. 


Im Gegensatz dazu nennt man jene Formen passiven Off-Ton, die das Bild in 
eine Atmosphäre hüllen und es stabilisieren; sie wecken weder das Bedürfnis 
nachzuschauen noch evozieren sie das Bild seiner Quelle, verändern mit an- 
deren Worten den Blickwinkel nicht. Der passive Off-Ton trägt nicht zur Dy- 
namik der Montage oder der Kameraführung bei, er bietet ganz im Gegenteil 
dem Ohr einen stabilen Ort (das Zusammenspiel von Stadtgeräuschen), 
was der Kamera erlaubt, sich frei im Dekor zu bewegen, Großaufnahmen 
in großer Zahl einzusetzen usw., ohne den Zuschauer in seiner räumlichen 
Orientierung zu beeinträchtigen. (Chion 1990: 75) 


2 «On appellera hors-champ actif celui dans lequel le son acousmatique [off] pose des 
questions (qu’est-ce que c’est? que se passe-t-il?) qui appellent leur réponse dans le 
champ et incitent le regard à aller y voir. Le son crée alors une attention et une curio- 
site qui tirent le film en avant, et il entretient l’anticipation du spectateur (J'aimerais 
bien voir la tête qu’il a quand l'autre lui dit ga»). Le hors-champ actif est essentiellement 
constitué de sons dont la source est ponctuelle, autrement dit correspond a des objets 
dont la vision peut étre localisée. Il est beaucoup utilisé dans le montage son/image 
traditionnel, en faisant entrer les objets et les personnages par le son, puis en les mon- 
trant (chevauchement). Certains films comme PsycHOSE reposent entièrement sur la 
curiosité créée par le hors-champ actif: comment est cette mére que l'on entend?» 

3 «On appellera hors-champ passif au contraire celui dans lequel le son crée une 
ambiance qui enveloppe l'image et la stabilise, sans susciter aucunement l'envie d’al- 
ler voir ailleurs ou d’anticiper la vision de sa source, donc de changer de point de vue. 
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Wahrend es im Fall des aktiven Off-Tons eine wichtige Rolle spielt, dass 
die Quelle nicht zu sehen ist, weil sie ein Ratsel stellt, das die Fantasie des 
Zuschauers beflügelt, ist es für den passiven Off-Ton völlig gleichgültig, 
ob die Quelle zu sehen ist oder nicht. Entscheidend ist vielmehr die Funk- 
tion, nämlich die Einbindung disperser optischer Fragmente in ein Raum- 
Zeit-Kontinuum und ihre Verankerung an einem spezifischen Ort. Von 
daher scheint es mir widersinnig, hier den Begriff hors-champ als Synonym 
für Off überhaupt beizubehalten. Die Problematik der terminologischen 
Erschließung eines neuen Gebiets liegt darin, dass die Versuchung groß 
ist, Neologismen zu schaffen, welche die Verwirrung vergrößern, statt sie 
abzubauen. 

Chions Vokabular hält einer genauen Überprüfung nur bedingt 
stand. Ausgehend von der zutreffenden Beobachtung, dass zwei verschie- 
denartige Bausteine zur klanglichen Beschreibung von Orten zu unter- 
scheiden sind, schlägt er folgende Begriffe vor: son ambiant, wörtlich zu 
übersetzen als Umgebungston, und element de décor sonore, zu Deutsch 
Element der Geräuschkulisse. 


Ich nenne jene Geräusche Umgebungston, die eine Szene einhüllen und den 
ganzen Raum erfüllen, ohne dass sich die Frage nach der Position und Be- 
schaffenheit ihrer Quelle stellt: die zwitschernden Vögel oder das Glocken- 
lauten.* (Chion 1990: 67) 


Ich nenne jene Geräusche Element der Geräuschkulisse, deren Quelle mehr 

oder weniger punktförmig und ab und zu sichtbar ist, die einen filmischen 

Raumbevölkern und ihm eine spezifische und klar lokalisierbare Färbung 

verleihen. 

[...] Ein typisches Element der Geräuschkulisse ist das entfernte Hundebel- 

len, das Telefonklingeln aus dem benachbarten Büro oder die Polizeisirene.® 
(Chion 1990: 47 f.) 


Le hors-champ passif ne contribue pas a la dynamique du montage et du découpage — 
sinon a contrario, puisqu'il pose pour l'oreille un lieu stable (l’ensemble d'une rumeur 
de ville), ce qui du coup permet au découpage de voleter librement dans le décor, de 
multiplier les plans rapprochés, etc. sans que le spectateur soit désemparé spatiale- 
ment.» 

4 «On appellera son ambiant le son d'ambiance englobante qui enveloppe une scene et 
habite son espace, sans qu’il souléve la question obsédante de la localisation et de la 
visualisation de sa source: les oiseaux qui chantent ou les cloches qui battent.» 

5 «On appellera éléments de décor sonore les sons de source plus ou moins ponctuelle et 
d'apparition plus ou moins intermittente qui contribuent a peupler et a créer l'espace 
d’un film par de petites touches distinctes et localisées. [...] Un son typique de décor 
sonore, c’est l’aboiement de chien au loin, la sonnerie du téléphone dans le bureau a 
côté, ou la sirène de voiture de police.» 
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Chions Beispiele verdeutlichen, dass die beiden Begriffe zwei Typen von 
Klangobjekten bezeichnen, die sich lediglich morphologisch voneinan- 
der unterscheiden. Das Vogelgezwitscher hat eine große zeitliche Aus- 
dehnung, während das Hundegebell nur vereinzelt zu hören ist. Mit dem 
Begriff Geräuschkulisse (décor sonore) führt Chion außerdem eine weitere 
Größe ein, die er nicht definiert, die aber aufgrund des Alltagsverständnis- 
ses einen Verbund von verschiedenen Geräuschen bezeichnet, welcher an 
einem bestimmten Ort zu hören ist. Die begriffliche Unschärfe wird noch 
vergrößert durch den weiteren Vorschlag, anstelle von son ambiant den 
Begriff sons-territoire (Territorial-Ton) zu gebrauchen, «weil sie einen Ort, 
einen spezifischen Raum mit ihrer kontinuierlichen und ausgedehnten 
Präsenz bezeichnen»° (Chion 1990: 67). 

Aufgrund meiner Untersuchung am Korpus gilt es, zwei Sachver- 
halte zu unterscheiden: das einzelne Element, das zur Charakterisierung 
des Ortes dient, zum Beispiel das Hundegebell, und die systemische Orga- 
nisation dieser Elemente zu spezifischen Bündeln, zum Beispiel «Hunde- 
gebell plus Grillen gleich südliche Nacht». Die beiden Sachverhalte stehen 
in einer hierarchischen, man könnte auch sagen paradigmatischen, Bezie- 
hung zueinander. 

Um das Element begrifflich zu fassen, greife ich auf die Termino- 
logie von Schafer (1977) zurück, der sich jedoch nicht explizit auf den 
Film bezieht. Er hat in Analogie zu land mark (Wahrzeichen) den Begriff 
sound mark geprägt, der Klangobjekte bezeichnet, deren Eigenschaften 
in besonderer Weise für die Menschen einer Gemeinschaft erkennbar 
und beachtenswert sind, wie zum Beispiel die Geräusche einheimischen 
Handwerks oder die Laute des Mah-Jongg-Spiels in China. Diese Klang- 
objekte sind jedoch so spezifisch, dass sie im Film nur dann eine Gegend 
charakterisieren, wenn sie explizit eingeführt werden. Die Lautsphären 
hingegen, welche nur im Hintergrund leise schwingen und dennoch viel 
zur zeitlichen und geografisch-kulturellen Situierung eines Ortes beitra- 
gen, nennt Schafer keynote sounds. Inder deutschen Übersetzung (Frank- 
furt a.M. 1988), die leider in vielen Bereichen sachlich ungenau ist, heißt 
Schafers sound mark «Orientierungslaut». Die Entwicklungsgeschichte die- 
ses Begriffs habe ich nicht weiter erforscht. In seiner alltagssprachlichen 
Zusammensetzung meint er jedoch genau das, was mir wichtig erscheint: 
ein Klangobjekt, das die Orientierung ermöglicht. 

Der Begriff Orientierungslaut bezeichnet nicht ein spezifisches Klang- 
objekt an sich, sondern dessen Funktion, einen Ort geografisch, zeitlich, 


6 <[...] parce qu'ils servent à marquer un lieu, un espace particulier de leur présence 
continue et partout épandue.» 
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kulturell, ethnisch oder sozial zu definieren. Hundegebell — um beim ein- 
fachsten Beispiel zu bleiben - kann auch die Quelle, einen bestimmten 
Hund nämlich, bezeichnen und hat dann eine indexikalische Funktion. 
Die Unterschiede zwischen den beiden Funktionen werden klanglich 
markiert. Das Hundegebell mit indexikalischer Funktion befindet sich im 
Vordergrund, während das Hundegebell mit Orientierungsfunktion via 
verminderter Lautstärke und zusätzlicher Raumparameter - insbesondere 
Hall - in den Hintergrund verlegt wird. Außerdem hat das Hundegebell 
mit indexikalischer Funktion einen Bezug zu einem Hund, der gewöhn- 
lich optisch repräsentiert und eventuell sprachlich mit einem Namen ver- 
sehen wird. Es handelt sich dabei also um ein Token (> 113). Der «Hund 
mit Orientierungsfunktion» hingegen ist nie zu sehen und wird auch sonst 
nicht weiter differenziert, bleibt also ein Typ. 

Die einzelnen Orientierungslaute sind auf der Tonspur in spezifi- 
schen, übergeordneten Strukturen organisiert. Als Begriff für diese Sub- 
strukturen schlage ich den bereits bestehenden Terminus Atmosphäre vor. 
Im Technikerjargon und für die Organisation von Geräuscharchiven hat 
sich der Begriff etabliert, um ganze Lautsphären sprachlich zu fassen, wie 
zum Beispiel Hafen, Bahnhof, Bergwiese. Auch seine alltagssprachliche 
Bedeutung passt zur Funktion. Dort verstehen wir darunter eine gewisse 
Stimmung, die einen Raum erfüllt. Diese Stimmung ist einerseits an die 
Raumakustik gebunden, an die Materialien, aus welchen dieser Raum 
geschaffen wurde, an seine Größe und geografische Situierung, aber auch 
an die Menschen, die diesen Raum benützen, und ihre Tätigkeiten. Es sind 
Parameter, die man sofort ganzheitlich erfasst und die sich direkt auf die 
emotionale Befindlichkeit auswirken. Unter Atmosphären werden im Fol- 
genden Sets von Orientierungslauten verstanden, welche zur Charakteri- 
sierung von Orten dienen. 

Eine ähnliche Rolle übernehmen die Atmosphären innerhalb der Ton- 
spur. Sie sind das akustische Setting, das sowohl die raumzeitliche Orien- 
tierung ermöglicht als auch den emotionalen Rahmen nicht nur für die 
Zuschauer, sondern auch für die Filmfiguren abgibt. 

Da sie ihren Informationsgehalt sofort entfalten müssen und dem 
Zuschauer keine besondere Aufmerksamkeit abverlangen dürfen, sind 
sie wahrscheinlich jener Teil der Tonspur, der am stärksten stereoty- 
pisiert und außerdem in hohem Maß abstrahiert und funktionalisiert 
wurde. Atmosphären werden deshalb auf ein Mindestmaß reduziert und 
bestehen im Allgemeinen aus distinkten Bündeln von zwei bis drei Orien- 
tierungslauten. Diese starke Kodifizierung ist nicht nur ein Erfordernis 
des Texts, sondern vor allem auch der Kommunikation mit einem disper- 
sen Publikum, welches auf diese schematisierten Informationen kondi- 
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tioniert wurde. Eine solche Reduktion ist tendenziell charakteristisch ftir 
den amerikanischen Mainstreamfilm. In Europa arbeitet man diese Raum- 
Zeit-Indikatoren wesentlich differenzierter aus, was sicher auch damit 
zusammenhängt, dass sie sich an ein homogeneres Publikum wenden, 
das diese Formensprache versteht. Im Besonderen besteht in der amerika- 
nischen Produktion eine Tendenz, die obligatorischen Orientierungslaute 
zu bevorzugen. 


Grundlagen 


Neben der Frage, wie diese Strukturen terminologisch gefasst werden 
können, interessiert mich ihre Funktionsweise, die bisher in der Filmwis- 
senschaft nicht erforscht wurde. 

Ähnliche Organisationsformen finden sich in den bereits erwähnten 
neuronalen Netzen. Auch andere theoretische Ansätze, die sich mit der 
Informationsverarbeitung und der Wissensrepräsentation auseinander- 
setzen, gehen davon aus, dass die Integration einzelner Sachverhalte in 
Verbünde zu den Grundmechanismen kognitiver Tätigkeit gehört. Sol- 
che Verbünde von neuen Informationseinheiten aus mehreren, vorher 
separaten Einheiten werden als Chunks bezeichnet (Kluwe 1990: 144). Die 
Chunks haben im Gedächtnis und in der Aktualisierung von Erinnerun- 
gen die Funktion, komplexe Wissensbestände zu vereinfachen, indem sie 
primär unter einem übergeordneten Aspekt zusammengefasst werden, 
während sekundäre Aspekte, die zu ihrer jeweils aktuellen Repräsenta- 
tion gehören, erst in einem späteren Stadium Beachtung finden. Interes- 
sant ist das Modell des Chunking für den vorliegenden Sachverhalt inso- 
fern, als in diesen Verbünden auch emotionale und pragmatische Aspekte 
integriert sind. Dies wird sofort deutlich, wenn wir uns einen bestimmten 
Schauplatz vorstellen, zum Beispiel einen düsteren Keller oder eine leere 
Fabrikhalle. Selbst wenn in der filmischen Repräsentation fröhlich spie- 
lende Kinder solche Schauplätze bevölkern, bleibt ein ungutes Gefühl, 
welches die Hypothese befördert, dass dieses Glück nur von kurzer Dauer 
sein könnte. 

Das Modell von Minsky (1975) geht von einer ähnlich ganzheitlichen 
Integration von Wissen in Substrukturen aus: 


In einer neuen Situation [...] greift man auf bestimmte Strukturen im Ge- 
dächtnis zurück, auf sogenannte Frames [...] Ein Frame ist eine Datenstruktur, 
die eine stereotype Situation darstellt, wie beispielsweise in einem bestimm- 
ten Zimmer zu sein oder zu einem Kindergeburtstag zu gehen. [...] Wir 
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können uns das Frame als ein Netz von Knoten und Beziehungen vorstellen. 
Seine oberen Niveaus sind fest und stellen Eigenschaften dar, die in der an- 
genommenen Situation immer zutreffen. Die unteren Niveaus haben viele 
Anschlüsse, sogenannte Slots, die mit spezifischen Eigenschaften oder Daten 
gefüllt werden müssen.” (Minsky 1975: 93) 


Minskys Begriff Frame hat sich in der psychologischen Terminologie nicht 
durchgesetzt, sondern wurde vom Terminus Schema abgelöst, den ich 
mit Kluwe (1992: 155) in folgender Definition verwende: «Schemata sind 
große Wissenseinheiten. [...] Exemplare eines Schemas lassen sich auf 
einem Kontinuum bezüglich ihrer Distanz zu einem Prototyp anordnen.» 

Aus der Schilderung von Minsky gehen einige Sachverhalte hervor, 
die für die weitere Argumentation wichtig sind. Zunächst die Stereotypi- 
sierung der mentalen Repräsentation von Situationen. Die Integration von 
pragmatischen Aspekten und Gefühlswerten kann dadurch erklärt wer- 
den, dass ähnliche oder gleiche Situationen immer wieder vorkommen, 
sowohl im täglichen Leben als auch verschärft in der medialen Repräsen- 
tation, und zwar in Verbindung mit ähnlichen Gefühlswerten und Skripts 
zur Verhaltensregulation. Die kognitive Organisation von Schauplätzen in 
Schemata ist die Folge des Lernens durch die Interaktion des Menschen 
mit der Umwelt. 

Einige Momente - die prototypischen — nehmen einen anderen Stel- 
lenwert an, weil sie stärker verfestigt sind als andere. Im Vergleich mit den 
obligatorischen oder fakultativen Merkmalen der Objektidentifikation 
sind feine Unterschiede feststellbar. Die prototypischen Elemente sind 
nämlich nur zu einem geringen Teil obligatorisch, weitere Elemente treten 
mit größerer Wahrscheinlichkeit auf als die sogenannten Slots, die deutsch 
als Leerstellen zu bezeichnen sind und die mit den fakultativen Merkmalen 
korrespondieren. Sie unterscheiden eine aktuelle Situation vom prototypi- 
schen Schema. 

Die Stereotypisierung von Atmosphären kann man als Komplexitäts- 
reduktion verstehen. Reale Lautsphären sind viel zu dicht, um in die Ton- 
spuren Eingang zu finden, wiefolgendes Beispiel — eine natürliche Laut- 
sphäre, wie sie in Mailand in einem Arbeitszimmer um 12 Uhr mittags im 
April zu hören war - zeigt: 


7 «When one encounters a new situation [...], one selects from memory a structure called 
a frame. [...] A frame is a data-structure for representing a stereotyped situation, like 
being in a certain kind of living room. Or going to a child’s birthday party. [...] We 
can think of a frame as a network of nodes and relations. The top levels of the frame 
are fixed, and represent things that are always true about the supposed situation. The 
lower levels have many terminals - slots that must be filled by specific instances or 
data.» 
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das hochfrequente Summen der Computerfestplatte 
das Klappern der Computertastatur 

verschiedene menschliche Stimmen in der Wohnung 
Staubsauger in der oberen Etage 

vorbeifahrende Autos 

bellende Hunde in der Nachbarschaft 

zwitschernde Vogel 

startende Autos 

. Hupen 

10. Motorräder 

11. Autoalarmanlage entfernt 


5O 0 Sy t DE El Ta 


Eine solche reale Lautsphäre ist nicht nur viel zu dicht, sondern auch 
wenig aussagekräftig. Obwohl Autoalarmanlagen im Sinne Schafers 
(1977) einen typischen Orientierungslaut für urbane italienische Orte dar- 
stellen, wäre dieses Klangobjekt als Bestandteil der Tonspur bereits mit 
zu viel vordergründiger Bedeutung behaftet, weil es nicht zum Lexikon 
der Atmosphäre Stadt gehört. Weiter werden 5, 8, 9 und 10 im Kontext 
Innenraum entweder auf ein unspezifisches Verkehrsrauschen im Hinter- 
grund reduziert oder völlig entfernt. Schafer (1977: 112) hat festgestellt, 
dass das Geräusch von Verbrennungsmotoren weltweit Lautphobien erzeugt. 
Gleichzeitig ist es so omnipräsent, dass es keine Information mehr enthält, 
und drittens ist es ein Breitbandgeräusch, das die Sprachverständlichkeit 
bedroht. 

Schafer (1977) und Truax (1978 und 1984) haben im Rahmen des 
World Soundscape Projects mit Wissenschaftlern aus aller Welt die geo- 
grafisch, saisonal und kulturell bedingte Verteilung von Geräuschen 
untersucht. Die Forscher haben an vielen Orten 24-Stunden-Protokolle 
der hörbaren Geräusche erstellt und ausgewertet. Sie haben die punktuel- 
len Datenerfassungen miteinander verglichen und für ganze Landstriche 
Karten erstellt sowie Tages- und Jahresprofile für die einzelnen Orte. Aus 
diesen Erhebungen gehen klare Gesetzmäßigkeiten hervor, die auch für 
die Gestaltung von Atmosphären eine Rolle spielen können, zum Beispiel, 
dass Frösche dann quaken, wenn die Vögel verstummen, dass Heuschre- 
cken nur von Anfang April bis Ende Juli zu hören sind. 

Einige Sound Designer haben ebenfalls aufwendige Recherchen 
getätigt, um spezielle historische oder geografische Situationen klanglich 
adäquat zu gestalten. Cecelia Hall (in LoBrutto 1994: 190) beispielsweise 
hat sich für Wırngss (USA 1985, Peter Weir) genauestens mit der Lebens- 
weise der Amish befasst, um ihre Einstellung zu Umwelt und Technik auf 
die Tonspur zu übertragen. 
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Mark Mangini betrieb für KArkA (USA 1991, Steven Soderbergh) 
ebenfalls ausgedehnte Studien in Prag und befasste sich mit Kafkas 
Werk: 


Ich habe Das Schloss, Der Prozess, eine Sammlung von seinen Briefen, einige 
Kurzgeschichten einschließlich Die Verwandlung und eine Biografie als Refe- 
renzmaterial gelesen. Ich wollte seine Welt verstehen und einige Hinweise 
auf die Geräusche seiner Umwelt sammeln. [...] Die Tonspur versucht diesen 
Eindruck mit ihrer relativen Leere nachzuahmen. Man hört darin nur sehr 
wenige Geräusche von Lebewesen und ganz selten ein Geräusch von einem 
anderen Menschen. Ich habe Grillenzirpen nachts innen und außen vermie- 
den, weil sie ein Gefühl von Wärme vermittelt hätten. Die Tonspur ist ziem- 
lich minimalistisch mit einzelnen verhallten und schrägen mechanischen 
Geräuschen.® (Mangini in LoBrutto 1994: 279) 


Häufig setzen sich Sound Designer jedoch über geografisch fundierte 
Gegebenheiten hinweg und wählen die Geräusche nur nach klanglichen 
und emotiven Gesichtspunkten aus: «In einem Film muss man das Pub- 
likum im Griff haben. Man kann die Wirklichkeit nicht einfangen. Ließe 
man Filme wie das richtige Leben klingen, würde das nicht funktionieren» 
(Beggs 1997). 

Die hochartifiziellen Abbildungsmechanismen, die natürliche Klang- 
sphären vereinfachen und nach einer Reihe konventionalisierter Regeln 
auf ein Lexikon expliziter Bedeutungen übertragen, gehören zum Wissens- 
bestand des Sound Designers und nur mittelbar zu jenem der Zuschauer, 
die nur intuitiv beurteilen können, ob die akustische Raumdarstellung 
stimmig ist. 

Diese Verdichtung komplexer Lautsphären in einzelne Orientierungs- 
laute nach narrativen Überlegungen kann als Synekdoche (> 166) verstan- 
den werden. Der einzelne Orientierungslaut aktiviert als Teil eines Ganzen 
ein fest verankertes Muster mit bildhaften, emotionalen und pragmati- 
schen Assoziationen. Der Informationstransfer wird damit extrem öko- 
nomisch, sowohl was die Gestaltung der Tonspur anbelangt als auch die 
Denktätigkeit der Rezipienten. Wenn die Schreie von Möwen allein den 


8 «lL read The Castle, The Trial, a collection of his letters, some short stories including Meta- 
morphosis, and a biography as reference material. I wanted to understand his world and 
get some clues about the sound of his environment. [...] The sound tends to mimic this 
in its starkness. You will hear very few sounds of life or living things, not many sounds 
of other human beings. I shunned the use of crickets for night exteriors and interiors, as 
I think they give too warm and cozy a feel to scenes. The track is pretty spare and uses 
disjointed reverberant sounds and odd mechanical activity.» 

9  «{...] ina movie [...] you have to control the audience. You can’t let reality intrude. If 
you made movies sound like real life, it wouldn’t work.» 
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Landschaftskomplex Meer/Strand/Küste aktivieren, wird auf der Tonspur 
Platz für die differenzierte Ausgestaltung von sekundären Merkmalen frei. 
Der ökonomische Aspekt wird in vielen Mainstreamfilmen durch 
die Strategie des Priming weiter optimiert (> 186). Wenn der Schauplatz 
das erste Mal zu sehen ist, findet eine breitere Exposition statt. Später im 
Film, wenn derselbe Schauplatz wieder auftritt, reicht es aus, in den ersten 
Sekunden einige wenige Orientierungslaute deutlich zu wiederholen und 
sie danach in den Hintergrund zu blenden. Eine solche Strategie ist exem- 
plarisch in 48 Hrs. (USA 1983, Walter Hill) zu beobachten, in welchem ein 
Polizeibüro zunächst reichhaltig exponiert wird (0.19.09-0.23.05): 


° Telefonklingeln 

e Stimmen im Hintergrund 
e Schritte raschelnd 

° Telefonklingeln variiert 

° Papierrascheln 

° Scheppern 

e Stimmen anschwellend 

° Telefonklingeln variiert 

e Papierrascheln 

° Stimmen im Hintergrund 
e Schritte raschelnd 

° Telefonklingeln variiert 

e Tasche auf Tischlegen 

° Tickern undefiniert im Hintergrund 


Diese komplexe und dichte Lautsphäre, die den Eindruck von Hektik und 
Geschäftigkeit vermittelt, wird im Laufe des Films zunehmend verdich- 
tet, bis das Telefonklingeln als alleiniger Orientierungslaut den Schau- 
platz Polizeibiiro anzeigt (1.15.11-1.19.18). Dieses Klingeln wird am Anfang 
der Szene eher im Vordergrund montiert und dann in den Hintergrund 
geschoben. 

Nun wäre es irreführend zu glauben, dass die Verwendung von 
Stereotypen als Orientierungslaute keine Kreativität mehr zulässt. Gril- 
len, einer der weitverbreitetsten Standards, kommen in Myriaden von 
Variationen vor, von denen einige tatsächlich gar keine Grillen sind, son- 
dern andere Insekten — Heuschrecken oder Zikaden - mit verwandter 
Geräuscherzeugung. 


Je weniger Geräusche man einsetzt, desto besser wird es. Die wenigen Ge- 
räusche sollten jedoch so viel wie möglich ausdrücken. Deshalb muss man 
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genau das eine passende Geräusch finden. Das kostet Zeit. [...] Wenn es eine 
Szene zeichenhaft beschreiben soll, muss es ihrer Essenz genau entsprechen. 
(Beggs 1997) 


Für die Unterwasserstation von SPHERE (USA 1998, Barry Levinson) 
wählte Beggs das Geräusch einer Lüftung als Orientierungslaut, das dieser 
Anforderung an die Essenz entspricht, weil es hintergründig die ständige 
Bedrohung mangelnder Luftzufuhr tausend Meter unter der Wasserober- 
fläche thematisiert. Dieses Lüftungsgeräusch wird so manipuliert, dass 
entsprechend der Tiefe im Raum - je tiefer, desto bassiger — oder der zwi- 
schenmenschlichen Situation — je angespannter, desto höher — eine Reihe 
von fein differenzierten Lüftungsgeräuschen einander ablösen, die unhör- 
bar ineinander geblendet werden und damit in ein Perzept - sprachlich 
gefasst als Lüftung — zusammenfallen. 

Die Orientierungslaute oder zumindest ein Teil davon bleiben im 
Allgemeinen für einen spezifischen Ort während des ganzen Films stabil, 
außer wenn gravierende Veränderungen stattfinden oder wenn ein gan- 
zer Film oder große Teile eines Films nur an einem einzigen Schauplatz 
angesiedelt sind. Bei außergewöhnlichen Schauplätzen, deren akustische 
Situierung nicht mit dem Standardrepertoire zu realisieren ist, werden 
für die einzelnen Schauplätze eigene Sets entworfen, die über Wieder- 
holung unabhängig von der visuellen Repräsentation werden. Ein Bei- 
spiel ist das feindliche Empire in der STAR Wars-Trilogie, das durch eine 
bassige Modulation charakterisiert wird. Dieses Klangobjekt hat keine 
vorgeformte referenzielle Bedeutung, sondern wird in STAR Wars (USA 
1977, George Lucas) etabliert. Das Verfahren zeigt deutliche Analogien zur 
vereinfachten Form der Leitmotivtechnik und baut auf den Mechanismus 
des impliziten Lernens auf. Die Rezipienten sind nach einmaliger Visio- 
nierung ohne Weiteres in der Lage, allein aus Fragmenten der Tonspur 
auf den Ort zu schließen; sie sind häufig sogar frappiert, wie deutlich die 
ganze Szenerie vor ihrem inneren Auge auftaucht. 


10 «The less sound you have, the better. Now, what you do have should say as much as 
you need to say. That means you have to find the exact, right sound. That’s a problem, 
because that takes time. [...] If you find a sound that is going to typify a scene, that 
sound has to contain the essence of what that is.» 
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Fallstudien 


Der Komplex Orientierungsfunktion der Tonspur ist ein dankbares Objekt 
fiir die quantitative Analyse des Korpus, das sich im vorliegenden Fall aus 
verschiedenen Genres zusammensetzt. Noch genauere Daten ließen sich 
ermitteln, wenn man ein homogenes Korpus untersuchen würde, Science- 
Fiction-Filme, Gefängnis- oder Kriegsfilme aus sechs Jahrzehnten. 

Wie in der Einleitung angesprochen, privilegieren Filme einzelne 
Schauplätze aus der Masse sämtlicher denkbarer Orte der Wirklichkeit. 
Im Korpus sind dies in der Reihenfolge ihres quantitativen Auftretens und 
ihrer häufigsten Orientierungslaute:" 


Nacht außen ohne spezifische Ortsangabe 10%: 
Grillen 70%, Hundegebell entfernt 25%, Frösche 14% 


Büro/Polizeibüro 8%: 
Telefonklingeln 47 %, Schreibmaschinengeklapper 33 % 


Schlafzimmer / Wohnzimmer /Wohnung 8%: 
(keine spezifischen Orientierungslaute) 


Stadt/Straße 7 %: 
Hupe 54%, Verkehrsrauschen 51%, Sirene 11% 


Bar /Restaurant/Nachtclub 7 %: 
Stimmen im Hintergrund 64%, Geschirrklappern 32 %, 
Gläserklingeln 30% 


Dschungel 6 %: 
Vogelrufe verhallt 75%, Grillen 35%, Frösche 14% 


Feld / ländliche Gegend / Land 4%: 
Vögel 69% 


Gefängnis/Gefangenenlager 4%: 
Metalltor 59%, Schlüssel 24 % 


Meer/Küste/Strand 3%: 
Wellen/Brandung 68%, Möwen 62% 


Die Atmosphäre Nacht außen primär als zeitlicher Index kommt nicht nur 
am häufigsten vor, sondern ist auch extrem stereotypisiert. In 70% aller 
Nachtdarstellungen sind Grillen zu hören, allerdings erst ab Mitte der 


11 Es versteht sich von selbst, dass sich diese Settings ungleichmäßig auf die einzelnen 
Filme und Genres verteilen. Die Prozentangaben sind Durchschnittswerte aus der 
Analyse des gesamten Korpus. 
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1940er-Jahre, zunächst noch selten, gehäuft ab Mitte der 1970er-Jahre. 
Nachtdarstellungen ohne Grillen sind durchweg negativ als unheimlich 
oder bedrohlich gekennzeichnet, entweder durch Regen, Wind oder durch 
unidentifizierbare Klangobjekte. Weitere negative Markierungen von 
Nacht sind - teilweise im Verbund mit Grillen - Käuzchen oder Zughupen / 
Zugvorbeifahrten entfernt verhallt. Das Hundegebell mit 25%, die Frösche mit 
14% sind ebenfalls erst ab Mitte der 1970er-Jahre zu hören. Die Kombina- 
tion Grillen und Hundegebell entfernt kommt ausschließlich in Nachtszenen 
vor, und zwar — unabhängig von der geografischen Situierung - in Afrika, 
im Orient, im Mittleren Westen, in Vietnam, in Neuseeland, sogar in Russ- 
land; vor Mitte der 1970er-Jahre jedoch nur in HEAT OF THE NIGHT (USA 
1966, Norman Jewison), wo die Nacht ein zentrales thematisches Motiv 
darstellt, und in THE GREAT Race (USA 1964, Blake Edwards). Grillen und 
Hundegebell entfernt sind demnach kein notwendiges, aber ein hinreichen- 
des und sehr wahrscheinliches Muster zur Darstellung von Nacht. Die 
Zughupe / Zugvorbeifahrt entfernt korreliert deutlich mit negativen Nacht- 
darstellungen in verlassenen ländlichen Gegenden, insbesondere dort, wo 
Mord und Totschlag stattfinden, das erste Mal in THz Bic House (USA 1930, 
George Hill), dann erst wieder im bereits erwähnten IN THE HEAT OF THE 
Nicut und ab Mitte der 1970er-Jahre unter anderem in THE DEER HUNTER 
(USA 1978, Michael Cimino). Besonders merkwürdig ist seine Verwendung 
im europäischen CARAVAGGIO (GB 1986, Derek Jarman), wo es mit der inne- 
ren Krise des Malers assoziiert wird, obwohl es nicht zur historischen Situ- 
ierung des Films im 16. Jahrhundert passt. Meine Interviewpartner — Sound 
Designer, die selbst mit diesem Klangobjekt arbeiten - konnten mir nichts 
über den Ursprung dieses eigenartig symbolischen Orientierungslauts 
sagen, der dennoch weit verbreitet ist. «Die beklemmende Atmosphäre in 
Lises Hotel wird durch das Geräusch vorbeifahrender Züge ausgedrtickt»”, 
schreiben Thompson/Bordwell (1994: 225) hinsichtlich Jean Gremillons LA 
PETITE Lise (Frankreich 1930). Auch der Sound Designer Gary Rydstrom (in 
LoBrutto 1994: 240f.) spricht diese Bedeutungsebene an. 


Beschreibung einer Figur-Umwelt-Relation 


Diese erste Fallstudie macht klare Tendenzen sichtbar. In erster Linie 
die äußerstspärliche Verwendung von Atmosphären im Hollywoodfilm 
bis Mitte der 1960er-Jahre. Erklärungen dafür finden sich in Bordwell/ 


12 «Much of the dreary atmosphere of Lise’s hotel is conveyed by a sonic motif of trains 
passing.» 
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Staiger /Thompson (1985), welche die wichtigsten Strategien des klassi- 
schen Hollywoodfilms zur Kennzeichnung von Schauplätzen beschreiben: 


Die klassische aristotelische Einheit von Zeit, Ort und Handlung, die durch 
standardisierte Verfahren wie Schwarzblende, Überblendung usw. gekenn- 
zeichnet wurde; das chronologische Fortschreiten der Zeit sowie die Ankün- 
digung von Abweichungen durch Zwischentitel, Kalenderblätter usw.; die 
Exposition eines neuen Schauplatzes über eine Totale. 
(Bordwell/Staiger/Thompson 1985: 61 ff.) 


Die von Bordwell et al. geschilderten Verfahren hauptsächlich optischer 
Natur liefern ein ausreichendes Regelwerk zur Organisation der raum- 
zeitlichen Situierung. Die Struktur an sich ist auf eine einheitliche, eindeu- 
tige Lesbarkeit hin organisiert, welche die Tonspur mehrheitlich von der 
Orientierungsfunktion befreit. 

Eine Ausnahme bildet die Filmmusik, die - ausgehend von der Tech- 
nik der couleur locale der Grand Opéra des 19. Jahrhunderts - ein eigenes 
System von Orientierungshinweisen auf Orte und Zeiten entwickelt hat. 
Teile einer ethnisch verankerten Musik - zum Beispiel Dixie oder spani- 
sche Gitarrenmusik — können einen Schauplatz charakterisieren; Hymnen 
wie das «Star Spangled Banner», die «Marseillaise» oder die «Internatio- 
nale» können — wie Brown (1994: 52) bemerkt - ganze politische Mytho- 
logien vertreten; Kirchenorgel, Trommelwirbel, Marschmusik, Wiener- 
walzer verfügen über jene Bedeutungen höherer Ordnung, die Barthes 
als Mythen bezeichnet. Seit der Stummfilmzeit haben Filmkomponisten 
auf diese stereotypisierten Codierungen höherer Ordnung zurückgegrif- 
fen, die sie entweder als Instrumentierungen, als metrische Grundlagen, 
als harmonische Strukturen — zum Beispiel die parallel geführten Quarten 
der epischen «Sandalenfilme» wie Quo Vapis? (USA 1951, Mervyn LeRoy) 
und Ben-Hur (USA 1959, William Wyler)” — oder als Motive und Themen 
in ihre Kompositionen integriert haben. 


13 Dieses Beispiel ist besonders aufschlussreich, weil von der römischen Musik nichts 
überliefert ist. Miklös Rözsa gründete seine Kompositionen auf antiken griechischen 
Quellen, weil er davon ausging, dass die römische Kultur hauptsächlich von griechi- 
schen Einflüssen geprägt war. Mit Quo VADpts? hat Rózsa die formalen Charakteristika 
«römischer» Musik im Film ein für alle Mal geprägt. Alex North hat sich dann aller- 
dings bei der Komposition zu Spartacus (USA 1960, Stanley Kubrick) bewusst von 
diesem Vorbild distanziert: «Ich wollte Musik komponieren, welche die Vergangenheit 
im Licht der Gegenwart interpretiert» («I wanted to write music that would interpret 
the past in terms of the present»; North in Karlin 1994: 20). 

14 Reichhaltige und vor allem auch musikwissenschaftlich fundierte Informationen zu 
diesen Verfahren finden sich in Brown (1994). Weniger anspruchsvoll und dennoch 
informativ sind die Publikationen von Karlin (1994), der sich sehr an der Praxis orien- 
tiert, oder von Chion (1995). Zum Einstieg in die Thematik Filmkomposition eignen sich 
weiter Gorbman (1987) und Thomas (1995). 
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Die formalen Strategien der Bildgestaltung, die Bordwell/Staiger/ 
Thompson auflisten, decken sich im Wesentlichen mit meinen Analysen 
des Korpus. Aufschlussreich sind vor diesem Hintergrund aber die Bei- 
spiele, die von diesem Regelwerk abweichen und in denen die nichtmu- 
sikalischen Elemente der Tonspur als aktiver Bestandteil in die Beschrei- 
bung von Orten und Zeiten einbezogen werden. Es sind dies im Korpus 
bis Mitte der 1960er-Jahre THE Bic House (USA 1930, George Hill), KING 
Kone (USA 1933, Cooper/Schoedsack), THE HURRICANE (USA 1937, John 
Ford), THıs LAND Is MINE (USA 1943, Jean Renoir), THE SNAKE Pir (USA 
1948, Anatole Litvak), TWELVE O’CLock Hicu (USA 1949, Henry King), 
FROM HERE TO ETERNITY (USA 1953, Fred Zinnemann), LAWRENCE OF ARA- 
BIA (GB/USA 1962, David Lean) und In THE HEAT OF THE NIGHT (USA 
1966, Norman Jewison). Mit Ausnahme von Kıng Kong haben diese Filme 
bei aller Unterschiedlichkeit eines gemeinsam: Sie zeigen Figuren in psy- 
chischen Grenzsituationen, Charaktere, die sich von der Norm unterschei- 
den und in einer konflikthaften Beziehung zu ihrer Umwelt stehen. 

Die gehäuft auftretenden Orientierungslaute charakterisieren in die- 
sen Filmen in erster Linie nicht einen geografischen Ort, sondern eine Rela- 
tion zwischen der Befindlichkeit einer Figur und ihrer Umwelt. Sie werden 
damit über den Hinweis auf einen Schauplatz hinaus Teil der psychologi- 
schen Zeichnung von Filmfiguren. Die Orientierungslaute können als Ele- 
mente einer latenten Subjektivierungstendenz interpretiert werden, welche 
die Umwelt aus der Perspektive des dünnhäutigen Individuums schildert. 
Damit simuliert die Tonspur einen Mechanismus, der auch in der Alltags- 
wahrnehmung vorkommt. Jeder kennt diese gereizte Empfindlichkeit, 
wenn alle Geräusche übermäßig stören. Psychologen, die sich mit den Aus- 
wirkungen von Geräuschen auf die Gesundheit auseinandersetzen (u.a. in 
Schick 1980, 1986, 1997), berücksichtigen, dass die Wertung und Wahrneh- 
mung von Geräuschen nicht nur mit ihrer physikalischen Beschaffenheit, 
sondern signifikant mit der psychischen Disposition des Hörers und der 
emotionalen Einstellung gegenüber dem Geräuschverursacher zusammen- 
hängt. So nervt uns das Gebell eines Hundes, wenn wir Hunde nicht mögen; 
in sehr viele nachbarschaftliche Auseinandersetzungen über Lärmimmis- 
sionen fließen negative Emotionen ein; und Beschwerden häufen sich, wenn 
in den Medien Berichte über gesundheitliche Schädigungen von Fluglärm 
erscheinen. Subjektive Wertung und psychische Disposition haben einen 
Einfluss auf die Aufmerksamkeit und Selektion (> 244). In stressigen Situa- 
tionen gelingt es dem System nicht mehr, irrelevante Informationen auszu- 
filtern und die Aufmerksamkeit auf jene Inhalte zu konzentrieren, die aktiv 
gesucht werden. Insgesamt wird die Aufmerksamkeit zu weiten Teilen von 
Einstellungen, Motivationen, Hypothesen und Antizipationen beeinflusst. 
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Im Mainstreamfilm werden seit Mitte der 1970er-Jahre subjektiv 
gefärbte Schilderungen der Umwelt mehr und mehr zur Strategie, beson- 
ders dort, wo es die psychologische Tiefe der handelnden Personen zulasst. 
Reine Aktanten, welche hauptsächlich der narrativen Konstruktion der 
Handlung dienen, wie zum Beispiel die Figuren in der INDIANA JONES- 
oder der STAR Wars-Trilogie, unterscheiden sich diesbezüglich von Figu- 
ren mit komplexem Innenleben wie selbst ein Chief Brody in Jaws (USA 
1975, Steven Spielberg) oder ein Captain Willard in APOCALYPSE Now 
(USA 1979, Francis Ford Coppola), noch mehr die unbestimmt vor sich 
hintreibenden Brüder Rusty James und Motorcycle Boy in RUMBLE FISH 
(USA 1979, Francis Ford Coppola) oder die vielschichtige Figur des Boxers 
Jake La Motta in Racinc Burr (USA 1980, Martin Scorsese). Ich will an 
dieser Stelle dem Thema Subjektivierung nicht vorgreifen, dem ein eigenes 
Kapitel gewidmet ist (> 362). Es geht hier lediglich um den Unterschied 
zwischen einer faktisch ausgelegten, primär dem Informationstransfer 
dienenden Zeichnung von Orten und Zeiten auf der einen und einer an 
der Befindlichkeit der Figuren orientierten Ausdifferenzierung unter sub- 
jektiven Gesichtspunkten auf der anderen Seite. 

Bereits die differenziert negative Gestaltung der Psychiatrie in THE 
SNAKE Pir - die mit dem gewaltsamen Happy End unvereinbar erscheint- 
oder der Gefängnisse in THE Bic House und THE HURRICANE benutzt nicht 
nur die standardisierten Sets, sondern auch weitere Hinweise auf den Ort, 
die man mit Minsky als Slots oder Leerstellen bezeichnen könnte, womit 
sekundäre oder auch fakultative Merkmale gemeint sind, die deutlich mit 
der Perspektive der Protagonisten korrespondieren. 

Zur Illustration eine Stelle aus Jaws (USA 1975, Steven Spielberg, 
0.12.58-0.17.23): Es ist die vierte Szene, die am Meeresstrand angesiedelt ist. 
Chief Brody sitzt am Strand, nachdem der erste Haiangriff ein Opfer gefor- 
dert und er vergeblich versucht hat, ein Badeverbot anzusetzen. Brody beob- 
achtet angespannt die Badenden. Folgende Klangobjekte sind zu hören: 


° Wasser gluckernd 

° Wasserspritzen leise 
e Wasserspritzen laut 

e Plätschern 

e Hundeknurren 

° Wind 

° Schreie 

e Wasserspritzen laut 

e Kinderstimmen 

° Wasserspritzen 
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e Wellen schlagend 

e Wasser spritzen laut 

° Wasser gurgelnd 

e Stimmengewirr aufgeregt 
e Wasserspritzen laut 

° Schreie 

° Wellen plätschernd 


Die üblichen Strandgeräusche, nämlich eine prototypisch stilisierte Bran- 
dung und Möwen, welche in den vorhergehenden Szenen diesen Schau- 
platz charakterisiert hatten, fehlen völlig. Es sind nur die Geräusche des 
spielenden Jungen, der das Opfer des nächsten Hai-Angriffs sein wird, ein 
Radio und das Wasser in verschiedenen Varianten zu hören, diese Geräu- 
sche aber deutlich überhöht. Die Schreie - eigentlich das übliche Gekreisch 
badender Teenies — werden im Kontext falsch interpretiert. Wind, Hunde 
knurrend, Wasser gluckernd und blubbernd und die spitz klingenden Wasser- 
spritzer markieren die Ungemiitlichkeit des Orts. 

Diese Szene kann man bestimmt unter dem Gesichtspunkt Subjekti- 
vierung (> 362) nochmals genauer betrachten. Sicher ist, dass das Meer 
zu diesem Zeitpunkt seine Unschuld verloren hat und bis zum Ende des 
Films ein feindlicher Ort bleiben wird. Die Möwen sind erst nach erfolg- 
reichem Kampf wieder zu hören, dann jedoch deutlich verfremdet, die 
gemütlich rhythmisierte Brandung überhaupt nicht mehr. Inder Zwi- 
schenzeit beschreiben eine große Anzahl von Variationen - unter anderem 
unspezifische Walgesänge, die weder sprachlich definiert, noch optisch 
oder räumlich verankert werden - einen sich ständig wandelnden Ort, 
dem man nicht trauen sollte. 

Es ließen sich zahllose weitere Beispiele für die latente Subjektivierung 
der klanglichen Beschreibung von Orten zitieren. Mit einem Beispiel aus 
LAWRENCE OF ARABIA (GB/USA 1962, David Lean) werde ich mich im Kapi- 
tel Material (> 342) detailliert befassen. Als Mittel zur Analyse empfiehlt es 
sich, die Veränderungen der einzelnen Schauplätze im Verlauf eines Films 
genauer unter die Lupe zu nehmen, und zwar auf dem Hintergrund der 
Stereotype, die normalerweise solche Orte kennzeichnen (— Tabelle 313). 

Eine signifikante Häufung von fakultativen Orientierungslauten, 
häufig gepaart mit einer exzessiven Verwendung, findet sich auch in 
einzelnen Werken, die vorwiegend das stereotype Repertoire aufbieten, 
und zwar dann, wenn die psychische Anspannung der Figuren deut- 
lich zunimmt. Das sind Situationen der Fremdheit oder Desorientierung, 
Showdowns oder Dunkelheit, wobei Showdowns, Desorientierung und 
Dunkelheit sehr häufig gepaart sind. 
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Fremdheit 


Es ergibt Sinn, dass Fremdheit mit gesteigerter Sensitivität der Wahrneh- 
mung korreliert, weil unbekannte Situationen schwieriger zu verstehen 
sind und die Aufmerksamkeit des gesamten Systems beanspruchen. Dazu 
Schafer: 


Das Ohr ist auf Reisen in unbekannte Gegenden immer wachsamer, wie die 
reichhaltige Reiseliteratur von vielen Schriftstellern beweist, deren Schil- 
derungen der Klangwelt normalerweise weit weniger detailliert sind — wie 
Thoreau, Heinrich Heine und Robert Louis Stevenson. Ein amerikanischer 
Student, der 1969 von einer Reise nach Rio de Janeiro zurtickkehrte, konnte 
die brasilianische Klangwelt wesentlich lebendiger beschreiben als diejenige 
seiner Heimatstadt New York. 

[...] 

Wenn man reist, dringen neue Geräusche ins Bewusstsein und werden des- 
halb in den Rang von Figuren gehoben.” (Schafer 1977: 211) 


Illustrativ als Beispiel ist eine Szene aus OUT OF AFRICA (USA 1985, Sydney 
Pollack, 0.24.41-0.33.13). Die Tonspur als Ganzes ist vergleichsweise kon- 
servativ angelegt, allerdings bei näherer Betrachtung mit sehr viel Gespür 
für die exakte Arbeit am Detail. Speziell im eher zurückhaltenden Gesamt- 
gefüge fällt die Häufung von unbestimmten, auch unangenehmen Klang- 
objekten auf. 


15 


Dampflokomotive schnaubend und zischend 
Dampflokomotiveschlagend 

Bremsendünnquietschend 

Schlagen stetig rhythmisch, undefiniert im Hintergrund 
Aufladen 

Dampflokomotive zischend 

Dampflokomotive rumpelnd 

Zischen 

Stimmengewirr fremdsprachig 

Hundejaulen 


«The ear is always much more alert while traveling in unfamiliar environments, as 
proved by the richer travelogue literature of numerous writers whose normal con- 
tent is acoustically less distinguished. This at least seems to be true of such authors as 
Thoreau, Heinrich Heine and Robert Louis Stevenson. Returning from a trip to Rio de 
Janeiro (1969), an American student was able to produce a much more vivid account 
of the Brazilian soundscape than of the city [New York] in which he lived. [...] When 
one travels, new sounds snap the consciousness and are thereby lifted to the status of 
figures.» 
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° Wagen rumpelnd und quietschend 
e Handwerksgeräusche 

e Hämmern 

e Quietschen undefiniert hoch 

e Jaulen undefiniert 

e Hundegebell 

° Wagen rumpelnd mittig 


Die Bahnhofsgeräusche sind zunächst noch szenisch motiviert, verselbst- 
ständigen sich jedoch mehr und mehr und werden in auffälliger Weise 
variiert. Das undefinierte rhythmische Schlagen knüpft morphologisch 
an die Geräusche der Dampflokomotive an und wird wahrscheinlich von 
den meisten Rezipienten ihr zugeordnet. Quietschen, Jaulen, Zischen sind 
UKOs mit allen im betreffenden Kapitel (> 126) geschilderten Implika- 
tionen. Wichtig ist, dass sämtliche stereotype Orientierungslaute, welche 
normalerweise eine tropische Landschaft bezeichnen, vermieden werden. 
Es sind keine netten Vögel zu hören, keine Grillen, keine gemütlich qua- 
kenden Frösche, kein feines Lüftchen. Alle diese Elemente, die später die 
afrikanische Landschaft beleben, fehlen in dieser Ankunftsszene, welche 
in der peinlich-distinguierten Stille des englischen Clubs endet, in dem die 
Protagonistin, Karen Blixen, als Frau unwillkommen ist. Die Stimmung 
resultiert zu großen Teilen aus dem Kontrast zu den übrigen Atmosphä- 
ren, der sich unter anderem in der ungewohnten quantitativen Dichte nie- 
derschlägt. Nicht zuletzt ist die subjektiv gefärbte Klanglichkeit dem Titel 
«Kenya, East Africa 1913» zu verdanken, welcher die historisch-geografi- 
sche Situierung übernimmt und die Tonspur vom Zwang zu faktischem 
Realismus befreit. 

Strategie und Aussage decken sich mit der Ankunftsszene in THE 
Prano (Neuseeland 1992, Jane Campion), die in dieser Arbeit unter dem 
Gesichtspunkt der Extension (> 153) besprochen wurde. 

Weiter ist Fremdheit ein Leitthema in allen Vietnam-Filmen von THE 
DEER HUNTER (USA 1978, Michael Cimino), ArPocALYPSE Now (USA 1979, 
Francis Ford Coppola) bis PLaroon (USA 1986, Oliver Stone). 


Desorientierung, Showdown, Dunkelheit 


Raum kann nicht nur definiert, sondern auch bewusst unbestimmt, schwe- 
bend gelassen werden. Der Orientierung im Raum steht die bewusste 
Desorientierung entgegen. Bildseitig sind es Gestaltungsmittel wie die 
Negierung des Raums durch eine begrenzte Schärfentiefe, durch diffuse 
Objekte und unscharfe Texturen oder durch die extrem ausschnitthafte 
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Darbietung des Raums durch Detailaufnahmen. Undefinierbare Geräu- 
sche und die diffuse Atmosphäre des Surround-Klangs, der nirgends im 
Bild verankert scheint, bewirken oder unterstützen diese Verunsicherung 
auf der Tonseite. Wenn es einen Orientierungslaut gibt, welcher — so para- 
dox das klingt — die Desorientierung markiert, so ist es das Tröpfeln ent- 
fernt verhallt. 

Ein Grenzfall der bewussten Desorientierung scheinen die großen 
Räume mit sehr langer Nachhallzeit zu sein, ein Raumtypus, der bereits 
in CITIZEN KANE ein Gefühl des grenzenlosen Unbehaustseins ausdrückt. 
Diese Art von kalten, leeren Räumen hat sich in aggressiven, spannungs- 
geladenen Szenen etabliert, die sehr häufig in Parkhäusern, Bauruinen, 
Fabrikhallen oder in langen unmöblierten Korridoren stattfinden. Der 
Showdown an großen, halligen, dunklen Orten, die womöglich unüber- 
sichtlich sind und in denen nur noch vereinzelte Geräusche von der 
Anwesenheit des unsichtbaren Gegners zeugen, ist ein Topos, der im 
Korpus 1966 das erste Mal in Jewisons IN THE HEAT OF THE NIGHT vor- 
kommt. 

Dunkelheit ist eine entscheidende Grundlage für die vermehrte Ver- 
lagerung der Informationen auf die Tonspur, weil das Bild nur mehr 
Schatten und Umrisse zeichnet, der Raum selbst jedoch versinkt. Gene- 
rell nimmt die Aufmerksamkeit in den verbleibenden Sinnesmodalitä- 
ten zu, wenn eine Wahrnehmungsform versagt. Jackson, der Klangfor- 
men in Ritualen verschiedener ethnischer Gruppierungen untersucht hat, 
stellt fest, dass die meisten Rituale in der Dunkelheit stattfinden (Jackson 
1968: 295). 

Desorientierung, in vielen Fällen ebenfalls gekoppelt an Dunkelheit, 
ist ein wiederkehrendes Motiv im Krieg. Das Bild des entwurzelten Sol- 
daten, der nicht mehr weiß, wohin er schießt und woher geschossen wird, 
taucht zwar in FROM HERE To ETERNITY (USA 1953, Fred Zinnemann) 
bereits auf, allerdings ohne von der Tonspur unterstützt zu werden. Ab 
Mitte der 1960er-Jahre seit THE Dirty Dozen (USA 1967, Robert Aldrich) 
gehörtes zu den Standards der Kriegsschilderungen, besonders in Viet- 
nam-Filmen, wo es durch die bereits geschilderte Fremdheit potenziert 
wird. In den Kriegsszenen in THE ALAMO (USA 1960, John Wayne) und in 
Patton (USA 1969, Franklin J. Schaffner) hingegen ist das Setting so ein- 
deutig ausgelegt, dass sowohl die Zuschauer als auch die Soldaten sich 
jederzeit orientieren können. In diesen beiden Werken sind die Protago- 
nisten bigger than life: Helden, die zwar in den Niederungen des Alltags 
straucheln können, im Krieg aber zu Höchstform auflaufen. 

In THE BLACK STALLION (USA 1979, Carroll Ballard), einem harmlo- 
sen Kinderfilm über die Freundschaft zwischen einem Jungen und einem 
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Pferd, ändert sich das Vokabular der Tonspur signifikant, als der Junge 
eine unübersichtliche dunkle Scheune betritt, in der er sein Pferd vermutet: 


° Wind 

° Vögel kreischend aufgeregt 
e Türe quietschend verhallt 

e Flattern entfernt 

e Poltern undefiniert 

e Raben entfernt 

° Scheppern 

e Katzenschrei heiser 

e Flattern von vielen Vögeln 
e Schritte polternd 


Der ungewöhnliche Stil von Sound Designer Alan Splet, der auch die Ton- 
spur einiger Werke von David Lynch (ERASERHEAD, THE ELEPHANT MAN, 
BLUE VELVET) gestaltet hat, ist im Allgemeinen daran zu erkennen, dass er 
die Klangobjekte gegen den Strich bürstet. Er arbeitet mit Tabus der Ton- 
spur oder stellt Stereotype in nie da gewesener Form zusammen. Auf der 
Suche nach überzeugenden Unikaten war ihm kein Aufwand zu groß: 
«Der Sound Designer Alan Splet reiste während langer Zeit um die ganze 
Welt, um Orte zu finden, an denen keine Flugzeuge zu hören waren, wie 
beispielsweise in Schottland, Wales und Norwegen. Dort nahm er Hinter- 
grundgeräusche für THE BLACK STALLION auf» (Cecelia Hall in LoBrutto 
1994: 190)." 

In dieser Szene, welche den Abschluss einer langen Irrfahrt durch 
verlassene Industriegebiete darstellt, häuft er Stereotype aus dem Reich 
des fantastischen Genres an, um einen unheimlichen Ort klanglich zu 
entwerfen. Er etabliert damit eine ästhetische Strategie, die ich als Genre- 
switching bezeichne: den Import von genrefremden Elementen, welche 
sich deutlich vom Kontext unterscheiden, zur klanglichen Markierung 
eines Umschwungs.” Der Begriff Genreswitching geht auf die Analogie 


16 «Sound designer Alan Splet had spent a lot of time traveling all over the world to 
places where there were no jets, like Scotland, Wales, and Norway, just to record back- 
grounds for THE BLACK STALLION.» 

17 Ähnliche Transformationen ins Vokabular des Horrorfilms finden sich in: 

RAIDERS OF THE Lost ARK (USA 1980, Steven Spielberg, 0.56.14-0.58.24): Unter Indiana 
Jones’ Anweisungen finden die Ausgrabenden einen Stein, der eine verborgene Kam- 
mer abdeckt; die ganze Szenerie wirkt geisterhaft; 

— INDIANA JONES AND THE LAST CRUSADE (USA 1988, Steven Spielberg, 0.43.00-0.52.43): 
stereotyper Donner und Regen, gepaart mit finsterem Schloss der Nazis; 

— ORLANDO (GB 1992, Sally Potter, 0.15.27-0.27.44): Orlando verliebt sich in Sasha; 

— THE Prano (Neuseeland 1992, Jane Campion, 0.54.46-1.00.04): Während eines Schat- 
tenspiels werden die Geräusche signifikant verändert. 
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zum linguistischen Terminus Codeswitching zurtick, mit welchem die 
Anpassung sprachlicher Ausdrucksformen an die Umgebung gemeint 
ist. Gebildete Sprecher sind in der Lage, je nach Situation — zum Beispiel 
bei offiziellen Anlässen, unter Fachkollegen oder im Freundeskreis - ein 
unterschiedliches, der Situation angepasstes Vokabular einzusetzen. 
Erwähnenswert als Beispiel für gezielte Desorientierung ist weiter 
eine Szene aus THE NAME OF THE Rose (Frankreich/Italien/BRD 1985, 
Jean-Jacques Annaud, 1.43.17-1.56.54), ebenfalls ein Showdown, in wel- 
chem der detektivische Franziskaner William von Baskerville und sein 
Adlatus sich im brennenden Labyrinth verirren. Laut Aussagen von Milan 
Bor, dem Mischtonmeister dieses Films, wurden die sich wandelnden 
Raumeigenschaften primär über ein Echo erzeugt, dessen Verzögerungs- 
zeit man bereits am Schneidetisch ständig verändert hatte, indem man die 
Klangobjekte zeitverschoben als Echo auf eine gesonderte Spur kopierte. 


Generalisierung versus Dichotomisierung 


Die formelhafte Beschreibung von Schauplätzen über stereotype Orien- 
tierungslaute kann als Generalisierung verstanden werden. Wie bereits 
beschrieben (> Stereotype 179) versteht man darunter die Uberbetonung 
von Ähnlichkeiten. Wenn Grillen und Hundegebell entfernt unabhängig von 
der geografischen Situierung in Afrika, im Orient, im Mittleren Westen, in 
Vietnam, in Neuseeland und sogar in Russland Nacht bedeuten, wird diese 
Strategie hörbar. Gleichzeitig bedeutet Generalisierung das Ausblenden 
von Unterschieden. 

Dichotomisierung auf der anderen Seite meint die Überbetonung von 
Differenzen. Auch sie dient der Orientierung, indem verschiedene Sach- 
verhalte durch Kontraste deutlich voneinander unterschieden werden. 
Eine solche Strategie lässt sich beispielsweise in RAGING BuLL (USA 1980, 
Martin Scorsese) beobachten, in dem der soziale Aufstieg Jake La Mot- 
tas durch Dichotomisierung überbetont wird: Das Milieu in der Bronx zu 
Beginn des Films erscheint besonders eng und aggressiv, aus allen Ecken 
klingen Kindergeschrei, Hundegebell und die Geräusche wenig kultivier- 
ter proletarischer Nachbarn; später (1.10.22-1.14.59) wirkt in einer feineren 
Wohnung alles gedämpft, die Schritte auf dem Teppichboden, das leise 
Rascheln von Papier, dezente Türen, nur ganz entfernt ist eine Sirene zu 
hören, die subtil der angespannten Stimmung entspricht. 

Jede Anordnung von Atmosphären auf der Tonspur kann als Zusam- 
menspiel von Dichotomisierung und Generalisierung verstanden werden, 
wobei die Generalisierung im Allgemeinen überwiegen dürfte. Dichotomi- 
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sierung herrscht beispielsweise vor, wenn in WITNEss zwischen der länd- 
lichen, nicht technisierten Sphäre der Amish und der urbanen Atmosphäre 
der Harrison-Ford-Figur unterschieden wird, in den bereits geschilderten 
Szenen aus JAws (> 317), OUT OF AFRICA (> 319) und THE BLACK STAL- 
LION (> 321), wo zumindest ein Teil der Aussage durch Kontrast zustande 
kommt. 

Besonders aussagekräftig ist eine Analyse der beiden komplementä- 
ren Verfahrensweisen in Strukturen, die per se spezielle Anforderungen 
an die Orientierung stellen. Das sind Parallelmontagen, Szenenübergänge 
und ähnliche Schauplätze mit unterschiedlicher narrativer Bedeutung, 
zum Beispiel die Raumstation der Guten versus diejenige der Bösen. 

In Parallelmontagen werden in der Mehrzahl aller Fälle die Unter- 
schiede besonders herausgearbeitet, sodass die Orientierung immer 
gewährleistet ist. Die kontrastreiche Aufbereitung der Atmosphären hat 
außerdem den Zweck, die Hektik zu befördern, indem sie die Schnitte per- 
zeptiv betont — atemberaubend umgesetzt in einer von John Ford insze- 
nierten Verfolgungsjagd in How THE West Was Won (USA 1961, Henry 
Hathaway / George Marshall / John Ford, 1.58.39-2.21.52), in welcher 
Pferde gegen einen Zug antreten. 


Fallstudie THE HUNT FOR RED OCTOBER: 
Dichotomisierung als Orientierungshilfe 


Der Spezialfall, in welchem verschiedene Schauplätze einem gleichen 
Typus angehören, jedoch zur Orientierung des Rezipienten verschieden- 
artig aufbereitet werden, ist für die Erörterung der Dichotomisierung 
besonders aufschlussreich. 

Eine solche Situation findet sich beispielsweise in THE HUNT FOR 
RED OCTOBER (USA 1990, John McTiernan). Große Teile dieses Films aus 
den letzten Tagen des Kalten Krieges spielen in verschiedenen U-Booten: 
einem amerikanischen und einem russischen U-Boot, dessen Kapitän ver- 
sucht, mitsamt seiner Crew zu den Amerikanern überzulaufen. Die Pläne 
des russischen Kapitäns sind komplex und werden erst nach und nach 
preisgegeben, hauptsächlich über die Analyse eines amerikanischen Spe- 
zialisten, der im Stil eines psychologisch geschulten Profilers versucht, die 
geheimen Motive des Russen aus einer Reihe von dispersen Beobachtun- 
gen heraus zu lesen. Insgesamt bietet die Narration ein eher diffuses Bild 
voller Andeutungen und Mehrdeutigkeiten, die sich in einem verstärkten 
Gebrauch von UKOs auf der Tonspur niederschlägt. 

Die Ausgangssituation zur Unterscheidung der beiden Schauplatze 
des Typus U-Boot wird weiter dadurch kompliziert, dass alle Hauptfigu- 
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ren englisch sprechen, womit die Sprache als Unterscheidung nur punktu- 
ell im Hintergrund eingesetzt werden kann. Mit Sean Connery in der Rolle 
des russischen Kapitans wird die good guy / bad guy-Strategie zur Unter- 
scheidung der beiden Gruppierungen weiter aufgeweicht. 

Es mussten visuelle und akustische Codes gefunden werden, welche 
dieser schwammigen Situation entgegenarbeiteten und die Lesbarkeit der 
Narration verbesserten. Über diese Strategien gibt Cecelia Hall, die als 
Supervising Sound Editor das klangliche Konzept für diesen Film entwor- 
fen hat, im Interview mit LoBrutto (1994) ausführlich Auskunft, sodass 
die analytischen Beobachtungen mit den kreativen Überlegungen abgegli- 
chen werden können. Wie sich dabei zeigt, büßt ein solches Konzept unter 
gewissen Bedingungen nicht nur seine Aussagekraft ein, sondern kann 
sogar ins Gegenteil der ursprünglichen Intention umschlagen. 

Als visuelles Konzept diente offenbar die etablierte Codierung Hell 
gleich Gut, Dunkel gleich Böse. Außerdem herrschen auf dem russischen 
U-Boot kalte Farbtöne vor: Blau und ein stechendes Gelb. Zusätzlich wer- 
den — wenn auch selten und ohne klar erkennbare Struktur — Titel ein- 
gesetzt, welche die Orientierung in Raum und Zeit unterstützen. Die 
optischen Unterschiede sind jedoch eher schwach und undeutlich. Öfter 
finden sich auch auf dem russischen U-Boot rote Lichter, welche das Farb- 
konzept durchbrechen. Das klangliche Konzept hingegen, das man sicher 
erst in einer späteren Produktionsphase ausgearbeitet hat, als die Pro- 
bleme mangelhafter Leitlinien zur Orientierung offensichtlich wurden, 
versucht, mit einer Reihe von Einfällen die Unterscheidbarkeit der beiden 
Hauptschauplätze zu stützen. 

Zunächst zur akustischen Zeichnung des amerikanischen U-Boots: 


Wir versuchten, dem amerikanischen U-Boot, der Dallas, eine sehr saubere, 
sparsame, harte Hightech-Atmosphäre zuzuordnen, der Leitbegriff hieß 
«sauber». Wir unternahmen für diesen Film mehr Nachforschungen und 
machten mehr Tonaufnahmen im Freien als je zuvor und als wir vielleicht 
auch je wieder machen werden. Wir verbrachten zwei oder drei Tage auf 
einem U-Boot. Wir hatten Marineberater einer privaten Firma, die für die 
Echolotsysteme in U-Booten topgeheime Computerprogramme entwickelt. 
Insgesamt haben wir sehr breit gestreute Nachforschungen angestellt, um he- 
rauszufinden, wie die Dinge klingen sollten. [...] Wir wollten eine freundliche 
Atmosphäre schaffen. Wir verwendeten vertraut klingende Computer. Der 
Nadeldrucker, den man in Büros hört und den die Leute wiedererkennen, ist 
genau jener Typ von Gerät, der in diesen U-Booten verwendet wird. Wir ver- 
stärkten diese Atmosphäre mit ADR-Aufnahmen von Stimmengewirr. Wir 
hatten technische Berater, die uns beibrachten, was die Leute reden sollten, 
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streuten aber auch Gespräche über die NBA, die Dodgers, die Yankees und 
über Duluth in Minnesota ein, um eine vertraute Umgebung zu schaffen, in 
der sich die Leute wohlftihlten. Die ZuhGrer sollten nicht versuchen, etwas 
Bestimmtes zu hören, sondern einfach Sätze und Wörter aufschnappen und 
begreifen, dass sie normales amerikanisches Gebrabbel wie überall hörten.'® 

(Cecelia Hall in LoBrutto 1994: 191 f.) 


Tatsächlich wird der Matrixdrucker zum essenziellen Orientierungslaut 
des amerikanischen U-Boots. Die Atmosphären dieses Schauplatzes sind 
deutlich weniger dicht als auf dem russischen, was zur ruhigen, freundli- 
chen Stimmung beiträgt. 


In Kontrast dazu wurden die Atmosphären des russischen U-Boots 


folgendermaßen entworfen: 


18 


19 


Weil der Kalte Krieg noch nicht ganz vorbei war, sollte es leicht unheimlich 
klingen [...]. Wir wollten, dass sich alles auf dem russischen Boot völlig 
fremd und andersartig anhörte, vor allem was die Oberflächen und was 
die Maschinen anging. Deshalb verwendeten wir Turbinen- und Fabrik- 
geräusche, die gespenstisch klangen, und stellten schräge Kombinationen 
zusammen. [...] Wir verbrachten lange vor der Mischung viel Zeit damit, 
Töne zu verändern und zusammenzufügen und schufen leicht unheimliche, 
ungewöhnliche, vage ominös klingende maschinelle Umweltgeräusche. 
Wir benutzten nur ausländische Computer [...]. Mein Material stammte aus 
Deutschland und Finnland, einige Aufnahmen auch von einem Freund aus 
Moskau. Die Grundidee war, das Publikum einer fremden Welt auszusetzen, 
in der es kein Geräusch identifizieren konnte, auf das es sich hätte stützen- 
können. [...] Dafür schufen wir eine viel härtere, metallische Umwelt, die 
gleichzeitig ein bisschen spitzer klang. Wir versuchten, ihr eine ganz andere 
Charakteristik zu verleihen als der Dallas.” (Cecelia Hall in LoBrutto 1994: 192) 


«We attempted to give the American submarine, the Dallas, a very clean, spare, hard- 
edged, high-tech sound, with the operative word being «clean». We did more research 
and more field recording for this movie than any movie we’ve done before and are 
likely to ever do again. We spent two or three days on a submarine. We had navy con- 
sultants from an independent company that does a lot of top-secret computer program- 
ming for the sonar systems that are put in submarines. So we did extensive research 
on what things were supposed to sound like. [...] We wanted to create a friendly atmo- 
sphere. We used familiar-sounding computers. The matrix dot printer you’re used to 
hearing in offices and that people recognise is exactly the kind of equipment that exists 
on those submarines. We reinforced that atmosphere with the ADR group walla. We 
had technical consultants telling us what they would specifically be saying, but we also 
sprinkled in discussions of the NBA, the Dodgers, the Yankees, and Duluth, Minnesota 
to give it a familiar sound so that people would be very comfortable. They wouldn’t be 
straining to hear anything; they’d just catch phrases and words and know they were 
listening to normal American babble they’d hear anywhere.» 

«We had to make it sound slightly ominous because the Cold War wasn’t quite over yet 
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Diese Strategie kann als Orientierung durch UKOs beschrieben werden, die 
dem Rezipienten eine normale auditive Objektidentifikation verweigert. 
Der akustische Kontrast zwischen den beiden Schauplatzen entsteht auf 
einer abstrakten Ebene aus dem Vergleich zwischen bekannten und unbe- 
kannten Klangobjekten. Die UKOs werden tiber ihre mehrheitlich metal- 
lische Klanglichkeit einem integrativen Konzept untergeordnet, das sich 
als Isotopie beschreiben lässt. Auch diese Bedeutung bleibt unterschwel- 
lig und ist der analytischen Interpretation kaum zugänglich. Die unklare, 
wenig konturierte Zeichnung des russischen U-Boots trägt viel zum 
Gefühl undeutlichen Misstrauens bei, das auch ständig thematisiert wird. 
Die russische Mannschaft selbst steht unter einem unheimlichen emotio- 
nalen Druck, der unter anderem dadurch zustande kommt, dass jederzeit 
eines ihrer Mitglieder das Unternehmen torpedieren könnte, das auch tat- 
sächlich von verschiedenen Intrigen bedroht wird. 

Ein weiteres Merkmal der Dichotomisierung ist die Gegenüberstel- 
lung von belebten und unbelebten Atmosphären. Auf dem russischen 
U-Boot fehlen menschliche Laute völlig, die auf dem amerikanischen 
ständig im Hintergrund präsent sind. Ein wesentlicher Sympathieträger 
der amerikanischen Besatzung ist Courtney Vance, ein Ultraschall-Spe- 
zialist. In der klaustrophobischen Situation des engen Settings inmitten 
einer nicht sichtbaren, unheimlichen Unterwasserwelt übernimmt er die 
Rolle des blinden Sehers, der als Audiophiler über seine äußerst geschul- 
ten Ohren mit der Umwelt im Dialog steht. Er hat die Verantwortung über 
die sichere Lenkung des Schiffs durch die unbekannten Gewässer. In einer 
Reihe von Szenen horcht er - und wir mit ihm — die unbekannte Klangwelt 
ab, bis er über einen Trick das angeblich lautlose russische U-Boot identi- 
fiziert; indem er die Tonbandaufnahme mit zehnfacher Geschwindigkeit 
laufen lässt, entlarvt er ein regelmäßiges Geräusch, das der Computer 
als tektonische Verschiebung des Meeresbodens interpretiert hatte, als 
das lautlose Antriebssystem des russischen U-Boots. Auf dem russischen 
U-Boot hingegen gelingt es bis zuletzt keiner Figur, vertrauenerweckend 


[...]. We wanted everything on the Russian ship to sound totally unfamiliar and differ- 
ent. It was a matter of surfaces and a matter of machinery. We used turbines and fac- 
tory sounds. We tried to use tracks that sounded weird. We made odd combinations. 
[...] We spent a lot of time processing and combining sounds long before we got to the 
dubbing stage to come up with slightly eerie, unusual, vaguely ominous-sounding 
kinds of ambient machinery noise. We only used foreign computers [...]. I got material 
from Germany and Finland. I got some tracks from a friend who had recorded material 
in Moscow. The key there was to put people in an unfamiliar surrounding and not to 
give them an aural ID that they could relate to easily. [...] So for that environment we 
created a much harder, metallic environment. We made that a little sharper. We tried to 
give it a very different characteristic than the Dallas.» 
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zu sein. Das kalte unbelebte Setting erstickt jedes Gefühl von Entspannung 
und Gemütlichkeit im Keim. 

In die akustische und visuelle Zeichnung von Schauplätzen und 
Figuren sind viele Überlegungen geflossen. Das Sound Design verlässt 
ausgetretene Pfade bequemer Stereotypisierung und wagt viel Neues. 
Seine ambivalente, über weite Streckenvage Aussage greift auf jene sug- 
gestive Verweigerung von eindeutig funktionalisierten Bedeutungen 
zurück und erzeugt ein Gefühl von Ohnmacht und Angst, welche ich im 
Abschnitt über das UKO beschrieben habe. Aus historischer und vielleicht 
auch kultureller Distanz entsteht jedoch ein Problem. Der Matrixdrucker 
und andere vertraute Computersounds haben ihre Stellung in der Zwi- 
schenzeit geändert: Sie sind zu Hinweisen auf eine veraltete Technolo- 
gie geworden, und so entsteht eine Aussage, die sich fundamental vom 
ursprünglichen Konzept unterscheidet. Die Amerikaner mögen zwar sym- 
pathisch und gemütlich wirken, gleichzeitig erscheinen sie jedoch auch 
als zurückgeblieben, und so treten sie — aus heutiger, mitteleuropäischer 
Sicht — mit veralteter Technik gegen die überlegenen Russen an. 


Fallstudie THELMA & LOUISE (USA 1991, Ridley Scott): 
Generalisierung in einer Parallelmontage 


Generalisierungen verwischen die Unterschiede zugunsten derjenigen 
Ähnlichkeiten, denen bei der Zeichnung von Schauplätzen, Figuren oder 
Stimmungen eine besondere Bedeutung zugeschrieben wird. Eine solche 
Strategie findet sich zum Beispiel in der Anfangssequenz von THELMA 
& Louise (ab 0.01.56), in welcher die beiden Protagonistinnen etabliert 
werden. Während die kesse und selbstbewusste Louise in der Kneipe als 
Bedienung arbeitet, räumt die devote und unselbstständige Thelma zu 
Hause im Morgenmantel die Küche auf und bereitet für ihren ungelieb- 
ten despotischen Ehemann ein Frühstück zu. Die beiden Schauplätze Res- 
taurant und häusliche Küche unterscheiden sich zu Beginn deutlich durch 
ihre unterschiedlichen Atmosphären. Im Restaurant erklingt laute Coun- 
try-Musik, verbunden mit Stimmengewirr und Geschirrklappern, in der 
Küche leise Musik aus dem Radio, ebenfalls kombiniert mit Geschirrge- 
räuschen. Im Lauf eines ersten Telefonats, in dem Thelma gesteht, dass 
sie noch nicht den Mut gefunden hat, ihren Mann um Erlaubnis für ein 
gemeinsames Wochenende mit Louise zu fragen, zieht sich Louise in einen 
ruhigeren Raum zurück, in dem die Musik nur noch leise, das Stimmenge- 
wirr kaum mehr zu hören ist. Nur das Geschirrklappern wird als Orientie- 
rungslaut weitergezogen. Damit findet eine Angleichung zwischen Loui- 
ses und Thelmas Raum statt. Beide Räume werden im Wesentlichen über 
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das Geschirrklappern charakterisiert. Im zweiten Telefongesprach ist die 
Atmosphäre in Louises Kneipe zwar dichter als in Thelmas Küche. Da die 
Country-Musik als charakterisierendes Element jedoch verschwunden ist 
und aus Thelmas Radio nun Stimmen zu hören sind, verwischen sich die 
Unterschiede weiter. 

In der anschließenden Montagesequenz (ab 0.05.52), in der die bei- 
den Frauen in Parallelmontage in ihren jeweiligen Schlafzimmern für das 
gemeinsame Wochenende packen, dominiert euphorische extradiegeti- 
sche Rockmusik, welche die potenziell unterschiedlichen Atmosphären 
maskiert und die beiden Frauen über die gut gelaunte Grundstimmung 
zusammenschweißt. Zwar werden in der Personenzeichnung Gegensätze 
betont — die extravertierte, emanzipierte Louise versus die verhuschte, 
ängstliche Thelma -, die sich auch im Gegensatz öffentlicher Raum Restau- 
rant versus privater Raum Kiiche spiegeln. Gleichzeitig aber unterwandert 
das Geschirrklappern als verbindendes akustisches Element einer weib- 
lichen Lebenswelt die postulierten Unterschiede. Und wenn die beiden 
Frauen aufgekratzt ins Wochenende aufbrechen, dann tauschen sie die 
Enge dieser Lebenswelt gegen die Weite des Cabrios auf den endlosen 
Highways, deren Orientierungslaute — das Brummen der Motoren, ver- 
schiedene Formen des Hupens sowie Reifenquietschen — symphonisch 
orchestriert sind. Das Geschirrklappern jedoch erinnert ab und zu an 
die frühere Enge, etwa wenn der Polizeiinspektor in Thelmas Wohnung 
(1.37.12-1.37.23) oder Louises Restaurant recherchiert (0.43.56-0.44.07), 
und an den beiden Tiefpunkten: der Aussprache zwischen den beiden 
Frauen nach der Erschießung eines Vergewaltigers (0.23.46-0.25.04) und 
später, wenn sie entdecken, dass Thelmas jüngste Eroberung ihr Geld 
gestohlen hat (1.00.32-1.07.31). 


11 Material 


Die materiellen Aspekte des Klangs sind bedeutsam fiir die Tonspur, weil 
sie die Mangel ausgleichen, die auf der Seite der taktilen und der visuel- 
len Wahrnehmung entstehen: Sie suggerieren Körperhaftigkeit und Drei- 
dimensionalität. Das Filmbild ist transparent, die Materialität der Objekte 
wird auf eine plane Fläche reduziert, oder anders gesagt: Das Filmbild 
entmaterialisiert die Objekte, die Geräusche geben ihnen die Körperlich- 
keit zurück. Im Geräusch werden jene Faktoren spürbar, die der Mensch 
im Lauf seiner Entwicklung zuerst taktil erfasst hat: Masse, Volumen und 
Textur. Differenzierungen wie hart und weich, kalt und warm, schwer und 
leicht sind bei der Filmrezeption vor allem anhand der akustischen Spuren 
möglich, welche die bewegten Objekte hinterlassen. 

Sichtbar ist die Erscheinung, die Oberflächenbeschaffenheit der 
Dinge, während die dahinter liegende Wirklichkeit, das Wesen der 
Objekte, sich im Klang äußert. Der Klang erschließt ein weites Reich sinnli- 
cher Qualitäten. Die Erfahrung dieser Qualitäten im Klang ist das Ergebnis 
des lebenslangen Umgangs mit den Objekten und Materialien. Wie Dinge 
schmecken, wie sie sich anfühlen, was man mit ihnen tun kann, wofür sie 
sich eignen, erfährt man nur durch den hautnahen Kontakt mit ihnen. Die 
akustische Rückmeldung der Dinge ist ein unverzichtbares Element zur 
Orientierung und zur Verhaltenssteuerung. Ob ein transparentes Objekt 
aus Glas oder aus Kunststoff besteht, lässt sich zweifelsfrei erst feststellen, 
wenn man es anfasst oder dagegenklopft. Auch ob eine Mauersolide oder 
morsch ist, untersuchen Fachleute über den Klang (Bellini 1993: 28). 

Oskar Fischinger wird das Diktum zugeschrieben, dass Klang die Seele 
eines unbelebten Gegenstands sei, das für John Cage bestimmend wurde 
(Metzger et al. 1978: 156). Wo immer Cage hinging, brachte er Objekte zum 
Klingen, um ihre tiefere Wesensart zu ergründen (Dyson 1992: 377). 

Die Akustik-Designer, die in der Industrie am Klang der Produkte 
feilen, versehen jedes Ding mit einem Klang, der Luxus und Dauerhaftig- 
keit suggeriert und den Erwartungen der Konsumenten entgegenkommt. 


Sicher hat keiner das Bedürfnis, einen Kühlschrank zu hören, auch einen Ge- 
schirrspüler oder eine Waschmaschine, die keinen Laut von sich gibt, könnte 
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man sich wünschen - ein optisches Signal für den Betriebszustand würde 
völlig genügen. Ein Espresso aber, der so ganz ohne Zischen und Ächzen aus 
der Maschine kommt, kann einfach nicht schmecken, ebensowenig wie ein 
Steak, das nicht hörbar in der Pfanne brutzelt, oder ein Champagner, dessen 
Korken sich lautlos davonmacht. (Hirschel/Wilsdorf 1993: 36) 


Als die Akustik-Designer Anfang der 1970er-Jahre lautlose Schreibmaschi- 
nen herstellten, waren die Proteste der Kunden so groß, dass sie die Tas- 
taturen wieder zum Klingen bringen mussten (Staudt 1993: 59f.). Selbst 
Bierflaschen werden so ausgelegt, dass das Bier glücklich klingt: Es gurgelt 
erst freundlich und schwingt sich dann über eine sanft ansteigende Melo- 
die zu einem erfrischenden Zischen hoch. Eine edle Limousine zeichnet 
sich durch ein gleichmäßiges harmonisches Fahrgeräusch und dezent-sat- 
tes Klacken der Türen aus. Jeder Apparat wird mit einem Sound ausgerüs- 
tet, und wenn ich auf dem Computer den Text abspeichere, antwortet die 
Festplatte mit ihrem Sirren ganz so, als ob sie mich verstanden hätte. Diese 
animistische Belebung der Dinge simuliert Kommunikation, wo gar keine 
stattfindet. 

Die Atmosphäre eines Raums ist weitgehend durch seine materielle 
Realisierung bedingt. Die flüsterleise Ambiance gemütlicher Räume ist an 
weiche, absorbierende Materialien wie Teppiche und Textilien gebunden, 
während kalte, abweisende Räume harte Oberflächen wie Stein und Beton 
haben. Farb- und Lichtsituation sind weitere Faktoren für die Wahrneh- 
mung von Räumen und Materialien. Im Gegensatz zur Klanglichkeit sind 
sie jedoch wandelbar. Der gleiche Raum, der im Feuerschein warm wirkt, 
vermittelt bei blaulichem Mondlicht ein Gefühl der Kälte, seine Akustik 
jedoch bleibt grundsätzlich stabil und kann nur in geringem Umfang vari- 
iert werden. 

Diese Stabilität der akustischen Parameter, ihr direkter Bezug zu den 
Dingen und Räumen, lassen das Geräusch in hohem Maß authentisch 
erscheinen. Ihre Authentizität borgt die Tonspur bei der taktilen Wahr- 
nehmung, dem unbestechlichsten der menschlichen Sinne. Sie bestimmt 
das Verhältnis von Glaubwürdigkeit und Manipulierbarkeit maßgeblich; 
auch Styropor-Felsstürze müssen so klingen, als ob die Brocken aus Stein 
wären. Die Lüge, wenn man so will, muss zumindest diesen Katalog von 
materiellen Eigenschaften berücksichtigen, um akzeptiert zu werden. 

In der sinnlichen Exploration von materiellen Eigenschaften der 
Objekte und ihrer nuancierten Wiedergabe liegt ein schier unerschöpf- 
liches kreatives Potenzial, das seit den frühen 1970er-Jahren vermehrt 
genutzt wird. Der Sound Designer Richard Beggs - ursprünglich Maler mit 
akademischer Ausbildung - hat im Interview diese Vermutung bestätigt: 
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Man muss das physische Wesen, die Eigenschaften der Objekte intuitiv oder 
sonstwie verstehen, mit der Welt der Dinge wirklich eins sein, um erfolgreich 
damit umzugehen. Wenn man dieses Verständnis einmal hat, kann man sich 
davon wegbewegen. Es ist wie der Kampf mit der Perspektive beim Malen. 
Tatsächlich haben Leute, die sie studiert haben, selbst wenn sie noch nicht 
alles beherrschen, einen Sinn dafür und sind viel, viel besser. Das ist die 
Grundlage des Vokabulars.' (Beggs 1997) 


Lucas’ Konzept der used future (> 125) beispielsweise bezieht seine Fas- 
zination aus der materiellen Dimension des Klangs, der rostig, staubig 
und schmutzig wirkt, im Gegensatz zu den hygienisch reinen Sinustönen 
des Science-Fiction-Films der 1950er-Jahre. Die große Variabilität von Tür- 
Sounds in THE SILENCE OF THE LAMBS (USA 1990, Jonathan Demme) oder 
von Boxschlägen in RAGING Butt (USA 1980, Martin Scorsese) gründet auf 
der minutiösen Recherche am materiellen Detail. Die sinnliche Qualität 
an sich wird zur ästhetischen Aussage nicht nur über das Objekt, sondern 
auch über die perzeptive Beziehung der Figuren zu den Dingen. Ähnlich 
wie die Schilderung der Umwelt aus einer latent subjektiven Sicht beinhal- 
tet die feine Nuancierung der materiellen Beschaffenheit eine fast unmerk- 
liche Verschiebung weg von einer objektivierten Darstellung hin zu einer 
perspektivisch gefärbten Wahrnehmung der Dinge und der Umwelt. 
Diese Dimension fehlt im narrativ funktionalisierten Klangobjekt der Hol- 
lywood-Klassik. Das immer gleiche Pferdegetrappel, die immer gleichen 
Türen und Schritte lassen eben diese perzeptive Qualität vermissen, die 
der Foley Artist Elisha Birnbaum anschaulich schildert: 


Stellen Sie sich eine Szene vor, in der Sie über harten Waldboden gehen, auf 
dem einzelne Steine liegen. Sie betreten eine Wiese, durchqueren ein Stück 
feuchtes, sumpfiges Land. Sie geraten schließlich auf einen sandigen Strand mit 
Korallensplittern. Während Sie ihn entlangschlendern, tauchen Sie die Zehen 
ins Wasser. Sie erreichen einen verwitterten Zementweg, der mit Kieselsteinen 
übersät ist; danach einen hölzernen Steg, der ins Meer hinausführt. Dort sprin- 
gen Sie in die Fluten. Nun haben Sie eine Vorstellung davon, wie viele Ober- 
flächen wir für diese kurze Szene brauchen. (Birnbaum in LoBrutto 1994: 152) 


1 «What is necessary is the understanding, intuitive or otherwise of the physical nature 
and properties of objects. You got to be really tied to the physical world to be success- 
ful. Once you have that understanding you are free to depart. It’s the same thing in 
painting, the struggle of drawing in perspective. But the facts is that people, who dealt 
with that and maybe not even mastered it, got that comprehension and are much, 
much better. That’s what the vocabulary is based on.» 

2 «Imagine a scene walking through a forest on hard dirt with occasional stones. You 
enter a grassy field, passing a wet and muddy stretch of land on your way. You finally 
emerge on a sandy beach with patches of crushed corals. Strolling along the beach, you 
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Selbst wenn solche Veränderungen mehr beiläufig rezipiert werden, sich 
jedenfalls kaum je in den Vordergrund des Bewusstseins schieben, bil- 
den sie doch ein unverzichtbares Fundament für die Vermittlung des 
unterschwellig affektiven Teils der Botschaft. Wie aus den Schilderungen 
modernen Akustik-Designs ersichtlich, steht auch der aufgeklärte Mensch 
des postindustriellen Zeitalters immer noch in einer stark instinktgeleite- 
ten Beziehung zur Umwelt, die sich so effektvoll manipulieren lässt, weil 
sie kaum je bewusst überdacht wird. 

Die subtile Ausdifferenzierung materieller Details auf der Tonspur ist 
nicht nur eine Frage der technischen Parameter. Bereits in der Frühzeit des 
Tonfilms sind Beispiele für die exakte Arbeit an der klanglichen Darstel- 
lung des Materials zu finden, zum Beispiel in THE Bic House (USA 1930, 
George Hill), in Kinc Kong (USA 1933, Cooper/Schoedsack) oder in THE 
HURRICANE (USA 1937, John Ford). Alle drei Beispiele stehen modellhaft 
für bestimmte Gründe, der materiellen Dimension besondere Aufmerk- 
samkeit zu schenken. Diese Gründe ziehen sich wie ein roter Faden durch 
die Filmgeschichte. 


° Die eingekerkerten Protagonisten von THE Bic House befinden sich 
einerseits in einer psychischen Extremsituation: Es sind Individuen, die 
in einer als feindlich erlebten Umwelt auf sich selbst zurückgeworfen 
sind. Außerdem schärft die eingeschränkte visuelle Wahrnehmung 
im Gefängnis die auditive Wahrnehmung. Die Gefängnismauern ver- 
sperren vielleicht die Sicht auf die Dinge, aber die Welt dringt über ihre 
akustischen Emissionen in die Zellen ein. In dieser eingeschränkten Er- 
lebniswelt wird jede Nuance zur Botschaft, die Art der Schritte draußen 
auf den Korridoren, die Bewegungen von Schlüsseln und Türen, die 
Geräusche der Zellennachbarn. 

° Kınc Kong als zweites Beispiel ist als Vertreter des fantastischen Films 
zu weiten Teilen in einer virtuellen Landschaft angesiedelt, die kein 
Mensch aus eigenem Erleben kennt. Im Bestreben, die Glaubwürdig- 
keit solcher Welten zu verstärken, wird die Tonspur vermehrt mit 
materiellen Details angereichert. Die zahllosen fiependen Displays 
des Science-Fiction-Films, die pompös ausgestaltete Klanglichkeit 
übernatürlicher Erscheinungen oder unbekannter Monster haben den 
Zweck, von der Kulissenhaftigkeit abzulenken und ein Dahinter zu 
suggerieren, den virtuellen Dingen Leben einzuhauchen und sie mit 


dip your toes in the water. You come to a broken concrete boardwalk with many peb- 
bles spread across it. After this you reach a wood pier extending over the water. At this 
point you dive into the water. This gives you an idea of how many surfaces we will 
need for this short scene.» 
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einer Funktion auszurtisten. Interessant ist in diesem Zusammenhang 
die Klanglichkeit des Körpers, die nirgends so deutlich zu hören ist 
wie in der Zeichnung von fremdartigen Wesen, Cyborgs und anderen 
Monstern. 

° THE HURRICANE schließlich steht für einen dritten Typus. Wie bereits 
geschildert (> Signale 166), spielt der Film eine gesteigerte Dichotomie 
zwischen einem papiergläubigen weißen Bürokraten und einem natur- 
nahen freiheitsliebenden Südseeinsulaner aus. Der Hurrikan ist als 
Naturerscheinung ein drittes Element, welches als übergeordnete Kraft 
die verlorene Ordnung wiederherstellt. Natur, Naturnähe und eine un- 
verfälschte Beziehung zu den Elementen bilden die Thematik, auf der 
die sensible Gestaltung der klanglichen Dimension gründet. 


Die psychologischen Grundlagen der Mensch-Material-Beziehung sind 
Gegenstand der ökologischen Psychologie, deren Hauptvertreter James ]. 
Gibson ist. Gibson hat im Zusammenhang mit der Interaktion Mensch — 
Umwelt den Begriff Affordance (1979) eingeführt. Unter Affordance versteht 
er von der Umwelt angebotene Handlungsaufforderungen. Grundlegend 
in dieser Auffassung ist die Annahme, dass der Mensch im Laufe seiner 
phylogenetischen Entwicklung dank der aktiven Exploration der Umwelt 
gelernt hat, die Eigenschaften und Bedeutungen von Umweltinhalten 
direkt zu extrahieren. Im Gegensatz zum konstruktivistischen Ansatz von 
Piaget geschieht dies nicht dank mentaler Repräsentationen, sondern auf 
der Basis von Invarianten, die in den Umweltinhalten - Orten, Objekten 
und Ereignissen - selbst liegen. 


Die sogenannten Affordances der Umwelt sind die Möglichkeiten, die sie dem 
Tier zu bieten hat, was sie bereit hält oder zur Verfügung stellt, sei es zum 
Nutzen oder zum Schaden. Das Verb to afford (bereithalten) kann man im 
Wörterbuch finden, das Nomen affordance hingegen nicht. [...] Ich bezeichne 
damit etwas, was sich sowohl auf die Umwelt als auch auf das Tier bezieht, 
und zwar in einer Weise, für die es keinen passenden Begriff gibt. Es beinhal- 
tet die gegenseitige Ergänzung von Tier und Umwelt. (Gibson 1979: 125) 


Als Affordance wird somit eine Relation eines Umweltangebots zu einem 
Lebewesen bezeichnet. Eine Oberfläche kann je nach Lebewesen als tra- 
gend oder nicht tragend wahrgenommen werden: Eine Wasseroberfläche 


3 «The affordances of the environment are what it offers the animal, what it provides or 
furnishes, either for good or ill. The verb to afford is found in the dictionary, but the 
noun affordance is not. [...] Imean by it something that refers to both the environment 
and the animal in a way that no existing terms does. It implies the complementarity of 
the animal and the environment.» 
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beispielsweise kann ein kleines Wasserinsekt, nicht jedoch ein Säugetier 
oder einen Menschen tragen; wenn über eine steile Klippe hinaus eine sta- 
bile Glaskonstruktion gebaut würde, hätten Menschen die größte Mühe, 
von der fest verankerten Affordance des Glases zu abstrahieren und diese 
Konstruktion zu begehen. 

Der Rückgriff auf die Theorie von Gibson erfolgt deshalb, weil nur 
dieser Ansatz die außerordentliche Geschwindigkeit erklärt, mit welcher 
Probanden aus einem komplexen Strukturangebot spezifisch materielle 
Eigenschaften extrahieren und ihr Verhalten der Bedeutung dieser Mate- 
rialien anpassen. Wie Knaus (1992) im Experiment nachgewiesen hat, sind 
die primären Aussagen über klingende Objekte Aussagen über Material 
und Beschaffenheit, wie zum Beispiel kleine metallene Gegenstände für Mün- 
zen oder Nägel. Die Klassifikation von materiellen Eigenschaften erscheint 
aus dieser Beobachtung wie eine übergeordnete Struktur, ein übergeord- 
netes Raster, in das die einzelnen Klangobjekte eingepasst werden. Tat- 
sächlich ist es — wie in Abschnitt Beschreibung (> 105) angetönt — beson- 
ders einfach, die materielle Herkunft von Klangobjekten zu beschreiben. 
Ob eine Metalltür oder eine Holztür quietscht, ist unmittelbar aus dem Klang 
zu erkennen. Auch Menschen mit geringer Instrumentenkenntnis können 
unterscheiden, ob sie Blech- oder Holzbläser hören. 


Physikalische Grundlagen der 
Material-Klang-Beziehung 


Um den Mechanismus systematisch untersuchen zu können, der diesem 
Reiz-Informations-Transfer zugrunde liegt, müssen wir Objekte als Reso- 
natoren begreifen, welche durch andere Objekte in Schwingung versetzt 
werden. Yost/Nielsen (1977: 33 ff.) und Buser/Imbert (1987: 82 f.) unter- 
scheiden zwischen zwei Arten von Schwingungserzeugung: 


a) perkussive oder freie Vibrationen: Das Objekt, einmal in Schwingung 
versetzt, findet seinen eigenen Modus. Beispiele: Pizzicato bei Saiten- 
instrumenten, Schritte, Türen 


b) forcierte oder erzwungene Schwingung: Das Objekt wird einer kontinuier- 
lichen Kraft ausgesetzt. Beispiele: gestrichene Saiteninstrumente, Blas- 
instrumente, Wind, Motorengeräusche 


Dabei können entweder beide, das treibende und das bewegte Objekt, 
oder nur das eine Objekt in Schwingung versetzt werden. Handel (1989: 
7), der sich in grundlegender Weise mit der Produktion von Schall durch 
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die menschliche Stimme, durch Musikinstrumente und nattirliche Objekte 
auseinandergesetzt hat, unterscheidet zwischen Streichen, Schlagen und 
Blasen als Klang erzeugenden Handlungen. 

Um einen hörbaren Klang zu erzeugen, müssen die vibrierenden 
Teile — bei den Streichinstrumenten die Saiten, bei einer Tür das Schar- 
nier — ihre Energie auf größere Klangkörper übertragen. Die resultierende 
Schwingung vereinigt deshalb verschiedene Komponenten: die Kom- 
ponenten der Schwingungserzeugung, ihre Übertragung und die mate- 
rielle Beschaffenheit des Klangkörpers, der nicht nur als Ganzes, sondern 
auch in Teilbereichen schwingt. Davon zu unterscheiden ist die Schall- 
erzeugung des Knalls. Darunter wird ein Schallstoß von großer Laut- 
stärke verstanden, beispielsweise ein Schuss oder das Platzen eines Bal- 
lons; er kommt durch energetische Übertragung direkt in das Medium 
zustande. 

Konzentrieren wir uns nun auf das Zusammentreffen zweier Mate- 
rialien. Nicht nur die Art des Materials ist ausschlaggebend für das ent- 
stehende Geräusch, sondern auch die Art der Schwingungsübertragung, 
die sich im Alltag hauptsächlich in Schlagen und Reiben unterteilen lässt. 
Unelastische, harte Schuhe auf hartem Untergrund, zum Beispiel Stein, 
erzeugenlaute, auffällige Geräusche mit perkussivem Charakter, während 
weiche Materialien, zum Beispiel Filzpantoffeln, verschliffene, leise Töne 
generieren. 


Wie stark ein Schwingungssystem ein anderes System in Vibration versetzen 
kann, hängt von zwei Faktoren ab: 1. wie ausgeprägt die treibende Frequenz 
und die Schwingungsfrequenz des zweiten Systems zusammenpassen; und 
2. von der Stärke der Verbindung oder der Kupplung zwischen den beiden 
Systemen.* (Handel 1989: 43) 


Als sekundäres System sind im Beispiel von Türen die Türblätter zu 
begreifen. Je nachdem, ob die Türe zugeschlagen, als Schiebetür auf 
Schienen geschoben oder in einer nicht geölten Angel langsam bewegt 
wird, kann der gleiche Resonanzkörper — das Türblatt - unterschiedlich 
klingen. 

Jeder Klangkörper hat eine spezifische, ihm eigene Resonanzfre- 
quenz. Wenn ein treibendes und ein schwingendes System lose miteinan- 
der verbunden sind, schwingt der Klangkörper in seiner eigenen Reso- 
nanzfrequenz. 


4 «The degree to which one vibration system can drive another system into vibration 
depends on two factors: (1) the match between the driving frequencies and the fre- 
quencies of the vibration modes of the second system; and (2) the strength of the con- 
nection or coupling between the two systems.» 
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Ein beeindruckendes Beispiel von Kupplung und Resonanz tritt ein, wenn 
ein Sänger ein Glas zum Bersten bringt. Das Glas hat eine Resonanzfrequenz, 
bei der die Schwingung das Maximum erreicht und die der Sanger bestim- 
men kann, indem er an das Glas klopft. [...] Trifft der Sänger diese Frequenz, 
versetzt die Druckwelle das Glas in Schwingung; ist der Schalldruck aus- 
reichend, werden die Schwingungen des Glases so stark anwachsen, bis es 
zerbricht.’ (Handel 1989: 43) 


Wenn das treibende und das schwingende System fest miteinander ver- 
bunden sind, dominiert das Schwingungsmuster des treibenden Systems, 
weil das schwingende in einen bestimmten Modus gezwungen wird. 

Modellhaft kann die Art und Weise der Schwingungserzeugung und 
-verstärkung als ein Quellen-Filter-System (source-filter model) beschrie- 
ben werden, wobei die treibende Kraft als Quelle, das schwingende Sys- 
tem als Filter aufgefasst wird. Das schwingende System verändert die 
ursprüngliche Vibration und gibt ihr ein eigenes Gepräge. So wird der 
Klang einer Geige ebenso durch die Form und materielle Beschaffenheit 
des Resonanzkörpers bestimmt wie durch die Schwingungen der Saite, 
die menschliche Stimme durch den Brustkasten und die Beschaffenheit 
des Vokaltrakts. Etwas komplizierter gestaltet sich dieser Austausch, 
wenn zwei Resonatoren im Spiel sind — beispielsweise ein Ball, der auf 
dem Boden hüpft, oder Schritte auf unterschiedlichen Oberflächen — denn 
dann haben beide Systeme einen Einfluss auf den Klang. Unter dem 
Gesichtspunkt des Quellen-Filter-Modells kann auch eine Schallquelle in 
einem Raum gesehen werden, wobei der Raum als Filter zu verstehen ist 
(Handel 1989: 50). 

Jedes Material besitzt eigene typische Charakteristika, die sein 
Schwingungsverhalten und seine Resonanz determinieren: Metall, Glas, 
Holz, Papier, Keramik, Plastik usw. Diese Resonanz und damit die Aus- 
wirkungen der Materialeigenschaften sind bei freien oder perkussiven 
Vibrationen deutlicher als bei forcierten. 


Somit enthält der Schall, welcher durch Impulsanregung eines zu Schwin- 
gungen fähigen Körpers erzeugt wird, ein hohes Maß an Informationen 
über dessen spezifische Eigenschaften. Dies ist der Grund dafür, dass man 
Werkstücke, Porzellan- und Glasgefäße, Bauteile von Musikinstrumenten 


5 «A compelling example of coupling and resonance occurs when a singer cracks a glass. 
The glass has a resonant frequency at which the vibration is maximum. The singer can 
discover the resonant frequency by tapping the glass. [...] If the singer matches that 
frequency, then the air pressure wave will set the glass into vibration. If the pressure 
wave is intense enough, the vibration of the glass will increase to the point that it will 
shatter.» 
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und viele andere Arten von Objekten durch Anklopfen und Abhören des 
entstehenden Schalls im Hinblick [auf] wichtige Merkmale beziehungsweise 
versteckte Fehler überprüfen kann. (Terhardt 1998: 7) 


Die klanglichen Charakteristika der Materialien hängen mit ihrer Elastizi- 
tät und der inneren Dämpfung zusammen. Holz beispielsweise verfügt 
über eine ausgeprägte innere Dämpfung, weshalb sein Klang als eher- 
dumpf oder weich empfunden wird, während Metall laute und schrille 
Klänge erzeugt. 

Die Resonanz wird darüber hinaus wesentlich beeinflusst durch die 
Faktoren Volumen und Masse. Ein kleines Objekt schwingt anders als ein 
großes, mit der Gesetzmäßigkeit, dass kleinere Objekte höhere Frequenzen 
erzeugen, während große aufgrund der größeren Wellenlänge im Material 
langsamer schwingen und deshalb Geräusche in tieferen Tonlagen abge- 
ben. Als Beispiel für diesen Sachverhalt bietet sich ein Vergleich zwischen 
kurzen und langen Saiten oder zwischen Piccolo- und Altflöten an. Hohle 
Körper klingen bei gleicher Energiezufuhr lauter als massive, da die Stei- 
figkeit und damit die innere Dämpfung kleiner ist, wenn die Ausdehnung 
der Wände gering ist. Neben Volumen und Masse wird als dritter Faktor 
der Aggregatzustand der Materie wirksam. Wasser als Dampf, kochendes 
Wasser oder Eis unterscheiden sich deutlich hinsichtlich der Klangpro- 
duktion. Dieselbe feine Differenzierung wird in Bezug auf die Temperatur 
der Luft wirksam: Die Geschwindigkeit der Schallwellen und die Tempe- 
ratur des Ausbreitungsmediums stehen in direkter Beziehung zueinander. 
Lufttemperatur und -feuchtigkeitsgehalt haben in Abhängigkeit von der 
Frequenz einen komplexen Einfluss auf die Schallausbreitung, der sich 
nicht auf einfache Regeln reduzieren lässt. 

Aus all diesen Überlegungen zu den Gesetzmäßigkeiten der Inter- 
aktion zwischen Materie und Klang wird eine Grundeigenschaft von 
Klang deutlich: die weitverzweigte Interdependenz aller am akusti- 
schen Geschehen beteiligten Faktoren, die nicht unabhängig voneinan- 
der betrachtet, sondern immer ganzheitlich im Kontext erfasst werden 
müssen. 


Die Klanglichkeit der Materialien im 
filmischen Kontext 


Im Folgenden steht die Frage im Vordergrund, inwiefern spezifische Mate- 
rialien mit ästhetischen Grundmustern, das heißt, mit stilistischen, narrati- 
ven oder genrebedingten Eigenheiten, korrespondieren. 
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Als eines der wichtigsten Biicher zur Geschichte der Materialien und 
ihres Klangs hat sich Schafers The Tuning of the World (1977) erwiesen. Es ist 
1994 in einer Neuauflage mit dem Titel The Soundscape. Our Sonic Environ- 
ment and the Tuning of the World erschienen. 

«Dass Schafers mystisch verklärt anmutende Ausführungen ver- 
wertbare Erkenntnisse für die Gestaltung eines Films liefern, erscheint 
zweifelhaft», meint Wolff (1995: 186). Wolffs Kritik wird zu widerlegen 
sein. Schafers Darstellungen gründen nicht immer auf wissenschaftlich 
fundierten Datenerhebungen, dafür zum Teil auf schwer überprüfbaren 
Sammlungen von oral history, die im Rahmen des World Soundscape Projects 
in verschiedenen historischen und kulturellen Situationen zusammenge- 
tragen wurden. Weitere Quellen, auf die er zurückgreift, sind Gesetzes- 
texte — zum Beispiel Lärmschutzverordnungen - und literarische Schil- 
derungen. Dem manchmal esoterisch anmutenden Hauch, der durch 
Schafers Publikation weht, muss man mit einer gesunden Portion Com- 
mon Sense begegnen. Es ist auf jeden Fall sein Verdienst, Zusammen- 
hänge zwischen Veränderungen in der Klangproduktion und weiteren 
sozialen und kulturellen Entwicklungen aufzuspüren. Insbesondere auf 
dem Gebiet der akustischen Veränderungen in der Umwelt ist seine Publi- 
kation bis heute als bahnbrechend zu interpretieren, weshalb sie auch ein 
starkes Echo findet. 

Die Analyse der Materialien und ihrer Klänge wird immer mit einer 
gewissen methodischen Unschärfe verbunden sein. Mein Vorgehen war 
zunächst quantitativer Natur. Ich habe alle Geräusche des Korpus einzeln 
in eine Auswertungsdatenbank übertragen, um sie nach ihren materiellen 
Ursachen zu klassifizieren. Ein erstes Ergebnis — die statistische Verteilung 
der verschiedenen Materialien - fördert ein deutliches Ungleichgewicht 
zutage. Bezugsgröße ist die Zahl von 24.933 erfassten Geräuschen insge- 
samt. 


Metall 1797 7,21% 
Wasser 1154 4,63% 


Holz 816 3,27 % 
Wind 393 1,58% 
Glas 378 1,52% 
Feuer 255 1,02% 


Geschirr 180 0,72% 
Donner 157 0,63 % 
Plastik 26 0,10% 
Gummi 25 0,10% 
Gas 2 0,01% 
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Dieses Ergebnis ist mit einer gewissen Vorsicht zu genießen. Quanti- 
tativ schlägt nur das Auftreten als solches zu Buche, während die zeit- 
liche Ausdehnung vernachlässigt wird. Wassergeräusche - zum Bei- 
spiel Regen oder Brandung - dehnen sich von Natur aus über einen 
weiteren Zeitraum aus, wobei klangliche Veränderungen jeweils zu 
einem neuen Eintrag geführt haben, zum Beispiel Regen rauschend, Regen 
prasselnd. 

Aufgrund der quantitativen Analyse sind zwei verschiedene Pro- 
file entstanden: ein spezifisches Materialprofil für jeden einzelnen Film — 
zum Beispiel zu THE Prano (Abb. 50, > 350) und TERMINATOR 2 (Abb. 51, 
— 354)- und ein diachronisches Profil für ein bestimmtes Material (Dia- 
gramme — 455ff.). Aus dem diachronischen Profil geht die historische 
Entwicklung der Verwendung bestimmter Materialien hervor, immer in 
Zusammenhang mit dem einzelnen Film. 

Die dabei entstehende Unschärfe ist tragbar. Es hat sich gezeigt, dass 
die quantitative Aussage als solche schon sehr aufschlussreich ist. Wesent- 
lich schwieriger wird es mit der Frage, warum an einer bestimmten Stelle 
ein bestimmtes Material verwendet wurde. Inwiefern gewisse Materia- 
lien mit stilistischen oder narrativen Grundmustern korrelieren, kann nur 
näherungsweise über die Interpretation bestimmt werden. In Einzelfällen 
sind die Muster sehr deutlich, zum Beispiel wenn in Showdowns oder 
Kampfszenen immer Metall zu hören ist. In anderen Fällen arbeiten ein- 
zelne Filme mit sehr feinen Abstufungen materieller Klanglichkeit, zum 
Beispiel mit mehreren unterschiedlichen Wassergeräuschen. Dann bietet 
sich zur Stützung interpretativer Hypothesen nur der Vergleich mit ande- 
ren Filmen an. 

Aus allen diesen Gründen ist eine allgemeine Theorie zum Thema 
Material auf der Tonspur nicht zu erwarten. Es liegt in der Natur der Sache, 
dass die Analyse zu weiten Teilen deskriptiv bleiben muss, womit allen- 
falls Tendenzen und Strategien sichtbar werden. 


6 Um vergleichbare Resultate zu erhalten, habe ich die Geräusche, die von einem be- 
stimmten Material erzeugt werden, zuerst in Relation zur gesamten Anzahl Geräusche 
des einzelnen Films gestellt. Danach habe ich den Maximalwert auf 100 gesetzt und die 
relativen Werte der anderen Filme in Beziehung dazu berechnet. Dieses Verfahren habe 
ich gewählt, weil einzelne Materialien im gesamten Korpus sehr unterschiedlich häu- 
fig vorkommen. 
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Zum Komplex von materiell definierten Geräuschen, welche durch 
die Geschichte des Gebrauchs ihrer Quellen geprägt sind, gehören die 
vier Grundelemente Feuer, Wasser, Luft und Erde. In diesen Elementen 
schwingt die jahrtausendealte Erfahrung des Menschen mit, der immer 
in einer spannungsreichen Beziehung zu ihnen gestanden hat, weil sie für 
ihn sowohl unentbehrlich waren als auch eine ständige Gefahr bedeute- 
ten. Es sind archetypische Geräusche, die einen großen Symbolwert besit- 
zen. Auch heute noch appellieren tosende Winde und prasselnde Feuer im 
Kino an uralte Gefühle. 

Der Wind an sich ist unhörbar. Er verursacht seine Geräusche nur 
durch Reibung an festen oder elastischen Objekten. Wind in Bäumen 
klingt anders als Wind im Gebirge oder in der Wüste. Heftiger Wind 
bedeutet Anspannung, Kampf und Bedrohung. Warme Winde wie der 
Föhnoder der Schirokko wirken lahmend und führen zu psychischen Ext- 
remzuständen. Schafer (1977: 171f.) bezeichnet den Wind als launisch, 
trügerisch und destruktiv, als das Element, dessen Unberechenbarkeit der 
Mensch traditionell am meisten fürchtet und das bis heute unbezähmbar 
geblieben ist. C.G. Jung zitierend, meint er, dass die unfassbare Gestalt des 
Windes als Archetypus einen geistähnlichen Charakter habe, der Urängste 
heraufbeschwöre. Das Geräusch des Windes wurde schon früh - bereits in 
der Antike - im Theater künstlich erzeugt, um die dramatische Dimension 
das Geschehens zu erweitern. 

Wind hat zu allen Zeiten des Tonfilms eine Rolle gespielt (Anhang 
Diagramm Wind — 455). Victor Sjöströms ursprünglich stumm gedrehter 
Film Tae Wino (USA 1928) wurde nachträglich mit Windgeräuschen ver- 
tont. Der Wind spielt hier leitmotivisch eine Rolle, die mit überbordendem 
sexuellen Begehren assoziiert wird, das zu Vergewaltigung und schließlich 
zu Mord führt. In Crrızen KANE (USA 1941, Orson Welles) ist Wind über 
dem ersten Bild des verlassenen Schlittens im Schnee zu hören, der für 
Kane die verlorene Kindheit symbolisiert. In Vincente Minnellis Lust FoR 
Lire (USA 1956), einem Biopic über Vincent van Gogh, treibt der unabläs- 
sige Mistral den psychisch instabilen Maler in den Wahnsinn. Wind kor- 
respondiert ebenfalls mit psychischer Labilität in TWELVE O’CLock HIGH 
(USA 1949, Henry King), in dem ein zunächst emotionsloser und heroi- 
scher Fliegergeneral am Ende seiner Kräfte einen Nervenzusammenbruch 
erleidet. Dieser Film - im historischen Umfeld der späten 1940er-Jahre 
einer der ersten, der ohne propagandistische Verklärung einen humani- 
tären Blick auf die psychischen Qualen des Krieges wirft - ist insgesamt 
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in seiner dokumentarisch wirkenden Authentizität der Zeit weit voraus. 
Diese Authentizität äußert sich unter anderem in einer subtilen Ausarbei- 
tung der materiellen Eigenschaften von Objekten und Räumen, die mit 
dem psychischen Verfall der Protagonisten korrespondiert. 

Weiter markiert Wind eine gespenstische, bedrohliche Stimmung in 
der zweiten Hälfte von BEn-Hur (USA 1959, William Wyler), als Ben-Hur 
in sein zerfallenes verlassenes Haus zurückkehrt, und später in der Welt- 
untergangsstimmung bei der Kreuzigung Christi, als seine Schwester und 
Mutter durch ein Wunder von der Lepra geheilt werden. Und in Viscontis 
MORTE A VENEZIA (Italien 1971) bringt der Schirokko Tod und Verwesung. 


Fallstudie LAWRENCE OF ARABIA 


Besonders aufschlussreich für die zunehmende materielle Differenzierung 
auf den Tonspuren der Neuzeit ist die Behandlung des Windes in Law- 
RENCE OF ARABIA (GB 1962, David Lean), in dem er ein zentrales Motiv 
darstellt. Er ist dort nicht nur natürlich erscheinendes Element eines geo- 
grafisch gegebenen Umfelds, sondern auf einer übergeordneten Ebene — 
der Ebene des Metadiskurses - ein symbolisch überhöhter Kommentar zur 
Entwicklung des Protagonisten. 

In ihrer Untersuchung zur optischen Repräsentation der Wüste als 
Schauplatz dieses Films stellte Kennedy (1994) eine deutliche Verände- 
rung fest: 


Der Charakter von Leans Wüste ändert sich mit der Art und Weise, wie Law- 
rence mit ihr und den Arabern umgeht. Die Darstellung der Wüste in der 
ersten Hälfte des Films unterscheidet sich deutlich von der Darstellung in der 
zweiten. Zunächst ist es eine reine, heroische Landschaft voller Herausfor- 
derungen und Schönheit, in der Lawrence sich allein oder mit Verbündeten 
und Freunden aufhält. Weite Panorama-Einstellungen vermitteln die Größe 
dieser Landschaft. In mittleren Distanzen setzt Lean immer wieder Dreiecks- 
kompositionen ein, die die Formen der Landschaft aufgreifen und für Stabili- 
tät sorgen. Moderne Technologie ist weit gehend abwesend. [...] 

In der zweiten Hälfte des Films steht die Wüste nicht mehr im Mittelpunkt 
und, was wichtig ist, sie verliert ihre Schönheit. Es gibt nur noch wenige 
Panorama-Einstellungen, hauptsächlich von abziehenden Armeen und von 
Massakern. Das Zentrum der Erzählung verlagert sich auf Schlachten und 
Zerstörung. Die moderne Technologie ist stärker sichtbar. Dreieckskom- 
positionen verschwinden. Vertikale und diagonale Linien treffen sich in 
seltsamen Winkeln und geben ein Gefühl von Instabilität und Chaos. Die 
Landschaften sind kantiger, steinig, flach, voll von Staub, Kriegsgemetzel, 
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Leiden, Tod und Fliegen. Lawrence setzt sich der Wüste nicht mehr alleine 
aus, sondern im Gruppenverband.’ (Kennedy 1994: 166) 


Dieser Wandel findet jedoch nicht nur in der bildlichen Darstellung ihren 
Ausdruck. Parallel dazu ist eine signifikante Zunahme von Windgeräu- 
schen feststellbar, welche die Veränderungen der Mensch-Umwelt-Rela- 
tion spiegelt. 

Der Wind ist das erste Mal zu hören, als Lawrence’ Gefährte Tafas 
erschossen wird (0.25.13-0.33.22), weil er aus einem stammesfremden 
Brunnen trinkt. Zusammen mit vereinzelten Geräuschen des Kamels 
steht ein leise flatternder Wind als isoliertes Geräusch in der Stille und 
markiert grenzenlose Verlassenheit. Hier wird die Wüste als existenzielle 
Bedrohung, als feindseliger Ort dargestellt. Musik fehlt ebenfalls, was das 
Gefühl von Leere und Verlassenheit unterstreicht. 

Wind in Verbindung mit windähnlichem unidentifizierbarem Sausen 
ist ein Grundelement der Grenzerfahrung, wie sie Lawrence und seine 
Begleiter bei der Durchquerung der Wüste auf dem Weg nach Akaba erle- 
ben (0.58.49-1.19.24). Der Triumph über die unmenschlichen Bedingungen 
ist bereits bitter gefärbt, was sich besonders in der klanglichen Zeichnung 
der Wüste aus einer deutlich verschobenen Wahrnehmungsperspektive 
mit verfremdeten Elementen niederschlägt. Diese Elemente sind klanglich 
dem Wind zuzuordnen. 

Sausender bis tosender Wind ist weiter ein zentrales Klangobjekt in 
der geisterhaften Stadt (1.50.01-1.58.12), in welche Lawrence mit einem 
seiner Begleiter kommt, nachdem der andere im Sand versunken ist. 

Von da anbis zur Niederlage, dem Verlust des Vertrauens bei den ara- 
bischen Freunden und der totalen psychischen und physischen Erschöp- 
fung, ist Wind in allen Szenen zu hören. Wind in allen Variationen — von 
leise sausend bis brausend und tosend — kommentiert Lawrence’ Tötungs- 
rausch und seinen zunehmenden Verfall. 


7 «The character of Lean’s desert changes along with the nature of Lawrence’s interac- 
tion with it and with the Arabs. The portrayed desert differs dramatically from the 
first half to the second half of the movie. Originally it is a clean, heroic landscape full 
of challenge and beauty where Lawrence is alone or with allies and friends. Panoramic 
shots show the scale of the landscape. In medium-range shots, Lean makes extensive 
use of triangular composition — reflecting the forms in the landscape and indicating 
stability. Modern technology is largely absent. [...] In the second half of the movie the 
desert is decentered from the narrative and, importantly, it loses its beauty. There are 
few panoramic shots, and those mostly of retreating armies and massacres. The narra- 
tive focus shifts to battle and destruction. Modern technology is more in evidence. Tri- 
angular composition is gone. Vertical and diagonal lines meet at odd angles, giving a 
sense of instability and chaos. The landscapes are harsher, rocky, flat, full of dust, war 
slaughter, suffering, death, and flies. No longer does Lawrence interact with the desert 
on his own, but in groups of people.» 
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48-49 


Die Assoziation Wind — psychische Grenzerfahrung ist in diesem Film 
besonders modellhaft ausgearbeitet. Obwohl der Wind im Allgemeinen 
als essenzielles Klangobjekt für die Wüste steht - in diesem Fall allerdings 
für den negativ besetzten Teil der Erfahrung -, fungiert er hier nicht als 
Orientierungslaut zur Bezeichnung des Settings. In vielen Teilen, die in 
der Wüste angesiedelt sind, fehlt er gänzlich. Der Wind ist nicht die Ursa- 
che von Lawrence’ Verfall, sondern ein expressives Stilmittel, diesen Ver- 
fall darzustellen und ihn sinnlich wahrnehmbar zu machen. Er bezeichnet 
nicht einen Ort, sondern eine zunehmende Desorientierung. Die launische 
Seite des Windes äußert sich in seiner ständigen Veränderung, welche die 
von Schafer beschriebene Unberechenbarkeit ausdrückt. Diese Verände- 
rungen befördern das Gefühl von Unsicherheit, Instabilität und Chaos. Sie 
entsprechen den chaotisch wirkenden Linien der grafischen Komposition, 
die Kennedy festgestellt hat. 

Die Verbindung von Wind mit psychischer Instabilität, mit Bedro- 
hung und Auflösung lässt sich mit einer Reihe von weiteren Beispielen 
belegen. Dazu gehören die Filme THE BLACK STALLION (USA 1979, Carroll 
Ballard), RAIDERS OF THE LOST ARK (USA 1980, Steven Spielberg), E. T. — 
THE EXTRATERRESTRIAL (USA 1982, Steven Spielberg), THE RIGHT STUFF 
(USA 1983, Philip Kaufman), Our OF AFRICA (USA 1985, Sydney Pollack), 
ALIENS — THE RETURN (USA 1986, James Cameron) und DANCES WITH 
Wo ves (USA 1990, Kevin Costner). 

Wind als Ausdruck von psychischer Anspannung war schon vor 
LAWRENCE OF ARABIA etabliert, wie die eingangs erwähnten Beispiele 
belegen. In diesen Fällen wurde der prototypisch heulende Wind aufge- 
boten, wie er sich in SHANE (USA 1953, George Stevens) bewährt hatte. 
Neu ist in LAWRENCE OF ARABIA, dass die Klanglichkeit des Windes in 
feinster Abstufung an die Entwicklung des Protagonisten angepasst wird. 
Leans Epos markiert den Beginn der Tendenz, die Dinge und Materialien 
nicht mehr nach objektivierbaren Grundlagen erzählökonomisch ein- 
zusetzen, sondern die sensorische Qualität des Materials an sich in eine 
Aussage mit emotionalem Appell zu überführen. Es wird - anders aus- 
gedrückt - der funktionalen Kommunikation eine Erlebnisqualität hinzu- 
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gefügt. Der Zuschauer wird subtil in die Wahrnehmungsperspektive der 
Protagonisten gezwungen, indem die klangliche Abbildung der Welt und 
der Dinge in der Welt sich laufend der psychischen Disposition der Hel- 
den und Heldinnen anpasst. Schon die Entscheidung, überhaupt Wind 
einzusetzen, ist — wie das Beispiel Lawrence zeigt — rein psychologisch 
motiviert. 

Der Wind ist nicht ein natürliches Element der Wüste, das einfach da 
ist, weil er nun einmal dazugehört, sondern er wird aus einer extradiege- 
tischen Perspektive wie Musik «hinzugetönt», anders als die Musik aller- 
dings unter dem Mantel des mimetischen Scheins. Jeder Zuschauer wird 
den Wind bereitwillig der Wüste zuordnen, ohne verstandesbetont nach 
seinem Sinn zu fragen. Die Sinnfrage stellt sich überhaupt erst nach der 
Analyse der Tonspur, dann nämlich, wenn die Korrespondenz zwischen 
der Klanglichkeit eines bestimmten Materials und dem emotionalen Sta- 
tus der agierenden Figuren transparent wird. 

Es ist kein Zufall, dass ein Film, der sich irgendwo zwischen euro- 
päischem Kunstfilm und epischem Mainstreamfilm ansiedeln lässt, zum 
Vorreiter einer Tendenz wurde. Vielmehr lässt sich an diesem Beispiel der 
historische Einfluss des europäischen Filmschaffens auf die Generation 
des New Hollywood nachweisen. Spielberg, Scorsese und Coppola, oder 
auch Friedkin und Cimino, um nur einige der herausragenden Figuren 
mit fundierter Kenntnis des europäischen Kunstfilms zu nennen, greifen 
diese Tendenz Anfang/Mitte der 1970er-Jahre auf und importieren sie 
gekonnt in die etablierten Erzähltechniken des klassischen Hollywood- 
films, den sie damit um die sensorische Dimension der Klanglichkeit 
bereichern. Spielberg und Scorsese haben sich deshalb persönlich für die 
Restauration und Reedition von LAWRENCE OF ARABIA eingesetzt (Frum- 
kes 1989: 288). 

Die Achse Wind-Grenzerfahrung wird in einigen Filmen von Steven 
Spielberg eingesetzt, vor allem in CLOSE ENCOUNTERS OF THE THIRD KIND 
(USA 1977), modifiziert auch in RAIDERS OF THE Lost ARK (USA 1980) und 
in E. T. — THE EXTRATERRESTRIAL (USA 1982). Frank Warner, der Sound 
Designer von CLOSE ENCOUNTERS, hat ein riesiges Arsenal von Windge- 
räuschen minutiös orchestriert: «Ich möchte für jede Einstellung einen 
anderen Wind» (Warner in LoBrutto 1994: 359). 

Später in der INDIANA Jon&s-Trilogie und in E. T. — THE ExTRATER- 
RESTRIAL setzt Spielberg das Windmotiv aus ironisierender Distanz ein, in 
E. T. — THE EXTRATERRESTRIAL unter anderem in der Froschbefreiungsszene 
(0.41.12-0.53.23), in welcher eine Parallelmontage die symbiotische Bezie- 


8 «lI want a different wind for every cut.» 
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hung zwischen Elliott und E. T. etabliert. Während E. T. einen alten Holly- 
woodfilm im Fernsehen schaut, in welchem eine stürmische Kussszene 
von rauschendem Wind untermalt wird, greift sich Elliott nach erfolgrei- 
cher Befreiung der Frösche in stereotyper Macho-Manier ein Mädchen, um 
es ebenso stürmisch zu küssen wie der Held im Fernsehen. Der Wind aus 
dem Fernseher geht nahtlos in einen diegetischen Wind über, welcher die 
Kussszene im Klassenzimmer begleitet. 

In RAIDERS OF THE LOST ARK wird die Bedrohung durch die all- 
gegenwärtigen Nazis personifiziert. Wo immer sie auftauchen, werden 
sie leitmotivisch mit Wind assoziiert, womit das Geräusch zum Label 
des Bösen schlechthin mutiert. Weiter wird der Wind im Sinne eines 
Genreshiftings als Element des Horror- oder Fantasy-Films zum charak- 
terisierenden Merkmal von ominösen übernatürlichen Erscheinungen, 
insbesondere beim Öffnen der Bundeslade. Der Bundeslade entströmt - 
von Wind begleitet - ein geisterhafter Nebel, der alle auflöst, die ihn 
anschauen. 

Diese zweite Schiene — die Assoziation von Wind mit Horror, oder 
mehr noch: Der Wind als zentrales Element des Horror-Genres — betont 
ebenfalls das Moment des Irrationalen, das dem Wind eignet und somit 
den Kern seiner symbolischen Bedeutung ausmacht. Typisch für die Ver- 
schiebung der Klangelemente in das Horror-Genre ist die Verbindung von 
rauschendem oder heulendem Wind mit verfremdetem undefinierbarem 
Sausen; fast immer kommt Donner dazu, häufig sind klappernde Fens- 
terläden oder hoch quietschende Türen zu hören. Als Beispiel für diese 
Strategie wurde bereits eine Szene aus THE BLACK STALLION (> Orien- 
tierung 321) beschrieben. Weiter findet sich eine solche Szene in BAcK TO 
THE FUTURE (USA 1985, Robert Zemeckis, 1.13.17-1.42.26), als der Prota- 
gonist auf seiner Zeitreise mit der Horrorvision konfrontiert wird, seine 
Eltern nicht verkuppeln zu können und deshalb nie geboren zu werden. 
Heulender und sausender Wind als Ausdruck von Bedrohung, Unwirt- 
lichkeit und Horror ist ebenfalls ein ständiges Element des von Monstern 
bewohnten fremden Planeten in ALIENS — THE RETURN (USA 1986, James 
Cameron). 

Leise rauschender Wind hingegen als Stimme der Natur ist nur in 
Our oF AFRICA (USA 1985, Sydney Pollack) und in DANCES WITH WOLVES 
(USA 1990, Kevin Costner) zu hören. Diese Filme werden in Insiderkreisen 
BırD and Foley-Filme genannt, weil sie ein eher dezentes Repertoire von 
leisen Geräuschen anwenden, vorwiegend Naturgeräusche sowie Schritte, 
Türen und andere handlungsgebundene Bewegungsgeräusche, die vom 
Geräuschemacher (Foley Artist) hergestellt werden. Diese Bezeichnung 
soll keine Geringschätzung ausdrücken, sondern lediglich auf ein anderes 
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Konzept hinweisen. Es ist ein sehr ökonomisch orientiertes Konzept der 
unterschwelligen feinen Nuancierung. Auf den Wind bezogen, sind das 
eher leise Geräusche, leise rauschender Wind im Gras oder in Bäumen, 
aber kein nervenzermürbender heulender Wind. Zwar ist auch der Kampf, 
den Karen Blixen in OUT OF AFRICA mit der Natur führt, ein Kampf von 
existenzbedrohender Dimension. Anders als Lawrence führt sie diesen 
Kampf jedoch nicht aus der sturen Position männlichen Heldentums, son- 
dern mit zunehmender intuitiver Empathie. Sie wächst sozusagen in die 
Natur hinein, ähnlich wie John Dunbar, der Protagonistin DANCES WITH 
WOLVES. 


Wasser 


Regen, ein Strom, ein Brunnen, ein Fluss, ein Wasserfall, das Meer: Alle er- 
zeugen einen einzigartigen Klang, aber alle teilen eine reiche Symbolkraft. Sie 
sprechen von Reinigung, Lauterung, Erfrischung und Erneuerung. 

Das Meer ist seit jeher eines der elementarsten Symbole des Menschen in 
Literatur, Mythos und Kunst. Es steht mit seiner Prasenz symbolisch fiir die 
Ewigkeit. Es ist ein Symbol fiir den Wandel durch die Gezeiten, das Auf und 
Ab der Wellen.? (Schafer 1977: 170) 


Die Vielfalt von Lautobjekten, die vom Element Wasser erzeugt werden 
können, ist fast unüberblickbar: Regen in allen Schattierungen, Hagel, 
Flüsse, Bäche, Meere, Wasser in Flaschen und Gläsern, Wasser als Eis und 
als Schnee, Wasser aus dem Hahn, aus der Dusche, im Swimmingpool, im 
Whirlpool, in der Badewanne. 

Blubbern, branden, brausen, bullern, donnern, gluckern, gurgeln, klatschen, 
plätschern, rauschen, sprudeln, schwappen, tosen, trommeln, tropfen, tröpfeln, 
zischen sind Wassergeräusche, die unmittelbareininneres Bild evozieren. 
Wasser als traditionell lebensnotwendiges Element verfügt über einen 
ausgeprägten symbolischen Gehalt, der in diesen Geräuschen immer mit- 
schwingt. 

Die Bewegung des Wassers selbst wird — wie Deleuze schreibt - seit 
den 1920er-Jahren neben anderen Formen der reinen Bewegung besonders 


9 «Rain, a stream, a fountain, a river, a waterfall, the sea, each makes its unique sound 
but all share a rich symbolism. They speak of cleansing, of purification, of refreshment 
and renewal. 

The sea has always been one of man’s primary symbols in literature, myth and art. It is 
symbolic of eternity: its ceaseless presence. It is symbolic of change: the tides, the ebb 
and flow of the waves.» 
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von der französischen Avantgarde als genuin kinematografisches Element 
aufgefasst: 


Eine noch tiefer gehende Strömung erfasste den französischen Film, wie 
wir sehen werden, eine generelle Vorliebe für das Wasser, das Meer und 
die Flüsse (L’Herbier, Epstein, Renoir, Vigo, Grémillon). Es war keines- 
wegs eine Abkehr vom Mechanischen, sondern im Gegenteil ein Ubergang 
von einer Festkörpermechanik zu einer Mechanik der flüssigen Körper, 
die von einem konkreten Standpunkt aus eine Welt mit einer anderen 
konfrontieren und in abstrakter Sicht im Bild des Flüssigen eine neue Ex- 
tension der Bewegungsqualität in ihrer Gesamtheit finden sollte: bessere 
Bedingungen, um den Bewegungen eine irreversible Dauer, unabhängig 
von ihren figurativen Eigenschaften, zu vermitteln, eine verlässlichere Ka- 
pazität für das Freisetzen der Bewegung aus der bewegten Sache.” 
(Deleuze 1983: 65) 


Wie immer haftet Deleuze’ Äußerung etwas Geheimnisvolles an, das 
mit dem bodenständigen schweizerischen Verstand nicht restlos geklärt 
werden kann. Tatsächlich ist Wasser, wenn es im Film zu sehen ist, stets 
bewegtes Wasser - in Flüssen, als Regen, als Brandung, in Brunnenoder 
Duschen - und als solches auch zu hören. 

John Cage komponierte 1952 mit «Water Music» ein erstes Stück, das 
die Begeisterung für reale Wassergeräusche in die westliche Kunstmusik 
einführte. Er thematisierte damit einen intensiven Zusammenhang zwi- 
schen Wasser und Hören. Fließendes Wasser faszinierte ihn als archai- 
sches Symbol der musikalischen Zeit und der Auflösung erstarrter Struk- 
turen durch die permanente Veränderlichkeit. Der Event-Künstler George 
Brecht baute Cages Faszination in Drip Music, einem Stück für tropfendes 
Wasser, aus. 


Das Geräusch tropfenden Wassers war das entscheidende Zeichen, dass 
die Schleusen geöffnet wurden. Es gab die 1960er-Jahre hindurch eine Flut 
wasserbezogener Happenings und Fluxus-Stücke, von denen viele mit 
Geräuschen arbeiteten, und einen Schwall gleichermaßen feuchter und 


10 «Un élan encore plus profond traversait ce cinéma francais, nous le verrons, un goût 
général pour l’eau, la mer ou les rivières (L’Herbier, Epstein, Renoir, Vigo, Grémil- 
lon). Ce n’était nullement un renoncement a la mécanique, mais au contraire le pas- 
sage d'une mécanique des solides à une mécanique des fluides qui, d'un point de vue 
concret, allait opposer un monde à l'autre, et, d'un point de vue abstrait, allait trouver 
dans l’image liquide une nouvelle extension de la quantité de mouvement dans son 
ensemble: de meilleures conditions pour passer du concret a l’abstrait, une plus grande 
possibilité de communiquer aux mouvements une durée irréversible indépendam- 
ment de leurs caractéres figuratifs, une puissance plus süre d’extraire le mouve-ment 
de la chose mue.» 
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geräuschvoller künstlerischer Arbeiten, der international unvermindert 
anhält. (Kahn 1996: 224f.) 


Seit Mitte der 1970er-Jahre teilt der Mainstreamfilm die Begeisterung 
für die Klanglichkeit des Wassers. Wasser ist das Element, das seither 
(> Anhang Diagramm Wasser 456) signifikant häufiger zu hören ist als je 
zuvor;inrund einem Viertel aller Szenen sind irgendwelche Wassergeräu- 
sche wahrnehmbar. 

In der Präsenz von Wasser im Film lassen sich zwei Haupttenden- 
zen ausmachen: Wasser als wohltuendes, lebensspendendes Element und 
Wasser als zerstörerisches, vernichtendes, kaltes Element. Die Zahl der 
Liebesszenen, die im und am Wasser situiert sind, ist schier unendlich. Sie 
sprechen das ozeanische Gefühl, die wohlige Regression an, die das Baden 
in warmem Wasser auslöst, das eine Segment symbolischer Bedeutung 
von Wasser. Modellhaft für diesen Aspekt ist die Liebesszene zwischen 
Sgt. Warden und Karen Holmes in FROM HERE TO ETERNITY (USA 1953, 
Fred Zinnemann), die in wohliger Selbstvergessenheit in der Brandung 
liegen. Die rhythmische Bewegung der Brandung selbst kann als Ersatz 
für den Liebesakt interpretiert werden, der entsprechend der Moral der 
1950er-Jahre in dieser Szene scheinbar nicht vollzogen wird. 

Auch in THE PLAYER (USA 1992, Robert Altman) sind alle Lie- 
besszenen von Wasser begleitet. So wie Griffin mit Bonnie Sherow 
im rauschenden, zischenden Whirlpool badet, sitzt er später mit June 
Gudmundsdottir im blubbernden Moorbad. Während eines Candle-Light- 
Dinners im exquisiten Wüstenrestaurant wird dieser Topos in ikoni- 
scher Weise installiert: Wir sehen ein Liebespaar, das im warmen Wasser 
turtelt. 

Von ähnlich zentraler Bedeutung wie der Wind in LAWRENCE OF ARA- 
BIA ist das Wasser in THE PIANO (Neuseeland 1992, Jane Campion). Bereits 
bei der Ankunft Adas in Neuseeland wird das Meer in allen Schattierun- 
gen klanglich aufbereitet, angefangen mit der dumpf blubbernden Unter- 
wasseraufnahme, welche am Ende des Films wieder aufgenommen wird, 
wo der Ozean als Grab bezeichnet wird. Das Meer erscheint in der Exposi- 
tion — die ich unter dem Stichwort Extension (> 155) ausführlich beschrie- 
ben habe - dominant als Naturgewalt: schäumend, tosend, brausend 
bricht es über den Strand herein. In Verletzung der Raumlogik zuguns- 
ten einer subjektivierten Wahrnehmung verschwinden die Geräusche der 
Natur in dem Moment, als Ada in die Holzkiste greift und auf dem Klavier 
spielt. Damit wird eine Dichotomie zwischen Natur und Kultur über die 
Materialien etabliert: Das Wasser steht für die Natur, während die Holzge- 
räusche der Zivilisation zugeordnet sind. 
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50 Materialien in THE PrANo (in Prozent aller wahrgenommenen Klangobjekte) 


Der Dschungel als Inbegriff des Wilden, Unzivilisierten ist eine 
feuchte Hölle. In Großaufnahme versinken die Schuhe Adas und ihrer 
Tochter im Sumpf, der klanglich mit einem Maximum an schleimiger 
Feuchtigkeit einhergeht. Später sind die erotisch gefärbten Klavierstun- 
den im Haus des Maori George Baines durchgehend von Wassergeräu- 
schen begleitet, Wasser, das unsichtbar irgendwo im Dschungel wohltu- 
end plätschert. Das Plätschern ist der verbotenen, aber sinnlich erfüllten 
Beziehung zu George vorbehalten, während alle misslingenden Versuche, 
die Liebe zwischen Ada und ihrem Mann Stewart zu entfachen, von rau- 
schendem, kalt wirkendem Regen begleitet werden. Auch die schreckli- 
che Rache, mit der Stewart den Verrat seiner Frau ahndet, findet im Regen 
statt. Nur einmal ist in Georges Haus Regen zu hören, und zwar dort, als 
er Ada das erste Mal küsst und ihr den Vertrag unterbreitet, das Klavier 
durch Liebesdienste wiederzuerlangen. Der Sinn dieser momentanen 
Auflösung eines sonst konsequent eingehaltenen Musters leuchtet nicht 
zwingend ein. Möglicherweise soll hier eine erzählerische Brücke zwi- 
schen dem Zwang durch eine arrangierte Heirat und dem Zwang durch 
einen absurden Vertrag geschlagen werden. Ansonsten bildet das mate- 
rielle Muster eine sichere Grundlage für die Interpretation des Gesche- 
hens. Zwar weckt das Verhalten Georges ambivalente Gefühle. Bevor wir 
wissen, dass er damit in Ada eine verschüttete Sinnlichkeit weckt, spüren 
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wir es. Wo das Wasser so lieblich klingt, antizipiert man aufgrund einer 
fest verankerten, um nicht zu sagen stereotypen Wasser-Liebe-Assoziation 
einen positiven Verlauf. 

Insgesamt ist THE PIANO ein eindrtickliches Lehrsttick der durch- 
dachten Anwendung von Materialien und ihren Klangen. Neben Holz 
und Wasser sind noch Wind und Donner zu hören, Porzellan ein einziges 
Mal (0.27.45-0.29.42), dabei so fremdartig, dass es auffällt. Diese Fremd- 
artigkeit wird unterstiitzt durch einen ungewohnlichen Kamerastand- 
punkt - die zerbrechliche Teetasse in Stewarts Hand wird in Detailauf- 
nahme von oben gezeigt — und ist klanglich eingebettet in ein langsames 
Uhrticken, das die peinliche Atmosphäre markiert. 

Die negative Assoziation Regen — misslingende Liebe findet sich nicht 
nur in THE PIANO, sondern auch in FROM HERE TO ETERNITY, wo der bereits 
erwähnten klassischen Liebesszene am Strand eine erste Begegnung bei 
strömendem Regen vorausgeht (0.15.10-0.23.09), die nichts Gutes erah- 
nen lässt. Regen begleitet ebenfalls die Begegnung von Thelma mit J.D. in 
THELMA & Lousse (USA 1991, Ridley Scott, 0.34.05-0.40.51), auch diese in 
Abenteuer mit negativem Ausgang. 

Regen, Pfützen und nass glänzende Straßen drücken bereits im Film 
noir Kälte und Verlorenheit aus und stehen in scharfem Kontrast zum 
romantischen Aspekt des Wassers. Entsprechend der untergeordneten 
Rolle, welche die Geräusche in den 1940er-Jahren auch in diesen Werken 
einnehmen, handelt es sich vorwiegend um visuelle Motive. Ihr klang- 
licher Aspekt bleibt unausgelotet. Wassergeräusche sind mehrheitlich 
schwer aufzunehmen, weil sie amorphe, breitbandige Frequenzverteilun- 
gen aufweisen, die sich erst mit der verbesserten Auflösung des Magnet- 
tons adäquat wiedergeben lassen (> Anhang Diagramm Wasser 456). 

Diese Regen-Pfützen-Tradition des Film noir greift THE PLAYER in der 
Mordszene auf (0.33.12-0.37.34), als der Drehbuchautor David Kahane 
sehr profan in six inches of dirty water stirbt, wie der begleitende Musik- 
titel heißt. Das verebbende Blubbern, das den Tod signalisiert, taucht 
später in der unsäglich stereotypen Produktion Habeas Corpus (1.13.13- 
1.16.25), einem Film im Film, wieder auf und begleitet dort das Sterben 
Julia Roberts’ in der Gaskammer. 

Die Pfützen sind ein Charakteristikum heruntergekommener, schä- 
biger Gegenden, von Parkhäusern oder Hinterhöfen oder tristen ländli- 
chen Gegenden. Das konspirative Treffendes Journalisten Woodward mit 
einem unbekannten Informanten namens Deep Throat in Pakulas ALL 
THE PRESIDENT’S MEN (USA 1976) findet in der atmosphärischen Klang- 
lichkeit nasser Straßen und schmutziger Pfützen statt. Der zunehmende 
Verfall des Jazzmusikers Charlie Parker im letzten Drittel von Birp (USA 
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1987, Clint Eastwood) geht einher mit einer signifikanten Veränderung der 
Klanglichkeit von Wasser in das kalte Plätschern von Pfützen und strö- 
mendem Regen. Diese Klanglichkeit von Wasser wiederholt sich in den 
Innenräumen mit der ständigen Präsenz von plätscherndem Whisky, wel- 
cher den Untergang begleitet. Und zuletzt passt das widerwärtig-klebrige 
Geräusch von Speichel im Mund in selten gehörter Genauigkeit in diese 
negativ besetzte Wasser-Flüssigkeits-Schiene. 

Der negative Aspekt von Wasser überwiegt auch in allen drei Viet- 
nam-Filmen des Korpus, signifikant zunehmend mit dem gesteigerten 
Grauen. Die Reise auf dem Fluss in ArocALYPsE Now, naturgemäß von 
Wassergeräuschen in allen Schattierungen begleitet, endet in Kurtz’ Lager, 
wo ständiger Regen niedergeht und es in unüberschaubar verzweigten 
Höhlen geisterhaft verhallt tröpfelt. Dasselbe Tröpfeln — wie vorne darge- 
stellt der Orientierungslaut der Desorientierung (> 320) - ist in PLATOON 
(USA 1986, Oliver Stone) in einem unterirdischen Bunker zu hören, der 
Regen strömt unablässig bei der intensivsten Szene des Films, dem Bru- 
dermord, als Sgt. Barnes, der bad guy, Sgt. Elias, den good guy, im Dschun- 
gel erschießt. Noch schrecklicher aber ist eine Szene aus THE DEER HUNTER 
(USA 1978, Michael Cimino): Steven, Michael und Nick sitzen in einem 
Bambuskäfig im Wasser, während oben mit den Gefangenen russisches 
Roulette gespielt wird, und das Blut der Opfer plätschernd in den Fluss 
fließt, der sich rot färbt. Die Farbe Rot wird in diesem Film in der beschrie- 
benen Expositionsszene (> Signale 162) sorgfältig etabliert und über die 
Lautstärke, über zahlreiche Signale und das Feuer der Stahlgießerei mit 
der Assoziation Hexenkessel verknüpft. Die Widerwärtigkeit der Bambus- 
käfigszene resultiert zu weiten Teilen aus der unangenehmen sensori- 
schen Qualität von Feuchtigkeit/Flüssigkeit, welche insbesondere durch 
die Vermischung von Wasser und Blut weiter befördert wird. Später im 
nächtlichen Saigon, als Michael vergeblich versucht, Nick vom Selbstmord 
im russischen Roulette abzuhalten, wird genau diese Assoziation wieder 
angesprochen: Rote Lichter spiegeln sich in den Pfützen der Straßen, und 
das Blut aus Nicks Wunde plätschert nach unten, irgendwo in die schwarz 
glänzenden Kanäle hinein. 

Das Thema Wasser auf der filmischen Tonspur wäre in seiner Kom- 
plexität ausreichend für eine eigene Arbeit. Zahlreiche Beobachtungen - 
unter anderem das Wasser in Jaws (USA 1974, Steven Spielberg) oder die 
modellhafte Musikalisierung von Regen im Tyrannosaurus-Angriff von 
Jurassic PARK (USA 1993, Steven Spielberg) — können im Hinblick auf die 
Informationsökonomie dieser Arbeit nicht erschöpfend behandelt werden. 
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Metall 


Im Gegensatz zum Wasser, das als Material über eine vieldeutige Ambi- 
valenz verfiigt, ist Metall im Alltag fast ausnahmslos hart und kalt. Der 
negative Aspekt wird auch in seiner Klanglichkeit spiirbar: Metall erzeugt 
durchdringende, schrille Klange. Das vielleicht markerschiitterndste 
Geräusch wird von Metall auf Metall produziert, von kreischenden Zug- 
bremsen und Säbelgerassel zum Beispiel. 

Die Bedeutung des Metalls, speziell des Eisens, rührt außerdem von 
seiner traditionellen Verwendung als Werkstoff für Waffen her. Schafer 
(1977: 163) belegt diesen Zusammenhang, indem er eine mittelalterliche 
Textstelle von Notker dem Stammler zitiert, eine heroische Beschreibung 
von Karl dem Großen in seiner Rüstung, welche die männliche Härte und 
kriegerische Unerbittlichkeit von Mensch und Material feiert. 

Diese archaisch anmutende Assoziation hat auf der Tonspur in 
bemerkenswerter Weise bis heute überlebt. Das männliche Universum des 
Terminators und anderer kriegerischer Figuren in verwandten Genres ist 
von Metall geprägt. Unabhängig vom tatsächlichen Vorhandensein von 
Metall werden seine Klänge ins Off verlegt oder in die Musik verwoben, 
wann immer Aggression die Szenerie beherrscht. Der Erfindungsreich- 
tum kennt kaum Grenzen, wenn es darum geht, Metall irgendwo zum 
Klingen zu bringen. Der Sound Designer Walter Murch (LoBrutto 1994: 
93.) schildert zum Beispiel, dass Coppola eine Einspielung des Walküren- 
ritts von Sir Georg Solti wegen ihres metallischen Klangs bevorzugt hat: 
Die metallische Klangfarbe der Blechbläser passte perfekt zum eisblauen Ozean." 
Metall spielt diese besondere Rolle seit den frühesten Tagen des Tonfilms 
(> Anhang Diagramm Metall 457). Ähnlich wie die Signale ist sein Klang in 
einem günstigen mittleren Frequenzbereich angesiedelt, der sich auch bei 
beschränkter Auflösung leicht abbilden lässt. 

Bereits die feindliche Umwelt des Gefängnisses in THE Bic House 
(USA 1930, George Hill) wird fast ausschließlich über metallische Klang- 
objekte vermittelt. In der Expositionsszene (0.00.54-0.13.36) sind allein 
drei verschiedene Sorten von Metalltüren zu hören: eine massive Schie- 
betür, eine dumpfe Stahltür und ein schweres Gittertor. Dazu kommen 
Schritte auf einer Metalltreppe, später verschiedene Variationen von Tür- 
schlössern und das metallische Klacken eines Schlagstocks. Eine Meuterei 
wird durch das rhythmische Klopfen von Hunderten von Blechtellern ein- 
geleitet, und selbst die Druckerpresse klingt metallisch. 


11 «The brassiness of that metallic sound went fully with the acidic blue of the ocean.» 
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51 Materialien in TERMINATOR 2 (in Prozent aller wahrgenommenen Klangobjekte) 


In ähnlicher Weise wird Metall als Merkmal einer unwirtlichen 
Umwelt in THE HURRICANE (USA 1937, John Ford) und THE SNAKE PIT 
(USA 1948, Anatole Litvak) eingesetzt. In THE HURRICANE sind es vor- 
wiegend metallisch klingende Schlüssel und das Rasseln von Ketten. 

Das Maximum an metallischer Klanglichkeit findet sich in TERMI- 
NATOR 2 - JUDGMENT Day (USA 1991, James Cameron). Die Terminators, 
gute wie böse, bestehen als Cyborgs, Roboter mit einem menschlichen 
Äußeren, aus Metall, das ähnlich wie Quecksilber die verschiedens- 
ten Konsistenzen und Formen annehmen kann. Metall und seine ver- 
schiedenen Aggregatzustände werden deshalb in diesem Film wie 
nirgends sonst zum Thema mit Variationen. Von kochend-blubbern- 
dem über sumpfig-schlürfendes bis zu eisig-crashendem Metall ist 
alles zu hören, was sich die auditive Fantasie überhaupt ausdenken 
kann. 


Wir klopften unermüdlich auf alle Arten von Metall. Das Archivgebäude 
der Skywalker-Ranch war gerade im Bau und rundum eingerüstet. Wenn 
wir heftig auf große, lange Gerüstteile schlugen, entwickelten sie ihre volle 
Resonanz. Dann mischte ich verschieden hohe Metallschläge so zusammen, 
dass sie zueinander passten und wie ein einziger Schlag klangen. Das ergab 
ein dumpfes bassiges Geräusch mit einem hohen Klingeln. [...] Alles musste 
bigger than life sein. Jedes Geräusch in TERMINATOR 2 musste klingen, als sei 
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es mit Testosteron voll gepumpt, es musste zu unwirklichen Dimensionen 
aufgeblasen werden.” (Rydstrom in LoBrutto 1994: 234) 


Die Genese solcher Geräusche wurde im Kapitel Verfremdung (> 285) 
genauer unter die Lupe genommen. Wichtig ist an dieser Stelle, dass die 
Materialitat als solche sowohl unter Gesichtspunkten der Gestaltung als 
auch der Narration thematisiert wird. Eine Reihe von verblüffenden visu- 
ellen Morphing-Effekten - zu Beginn der 1990er-Jahre der letzte Schrei in 
der Computeranimation — breitet die unendliche materielle Wandlungs- 
fähigkeit des Terminators aus. In dieser übermenschlichen und überphy- 
sikalischen Materialität sieht Grodal (1994) ein konstituierendes Moment 
der tiefsten Verunsicherung: 


Diese Unsicherheit wird unterstützt durch einen Teufel aus der Zukunft, der 
offensichtlich nicht von den normalen Gesetzen der Kausalität beherrscht 
wird: Er kann seine Form nach Belieben verändern. Zielgerichtetheit und 
Berechnung setzen einige Regeln voraus, die den Umgang mit der Welt er- 
möglichen, aber der «Teufel» scheint sich außerhalb der menschlichen Regeln 
zu bewegen, da er den physikalischen und biologischen Gesetzmäßigkeiten 
nicht unterworfen ist.’ (Grodal 1994: 121) 


Die emotionale Komponente wird somit direkt durch die sich wandelnden 
Materialeigenschaften ausgelöst, denen mit natürlichem Verstand nicht 
beizukommen ist. Sie ähneln der unbeherrschbaren, irrationalen Kompo- 
nente des Windes, dessen emotionaler Appell auf der gleichen Unfassbar- 
keit beruht. 

Der aggressive Klang von Metall beherrscht auch die Zeichnung der 
Psychiatrie in TERMINATOR 2 (0.12.46-0.14.34) mit einer Vielzahl unge- 
wöhnlicher Klangobjekte wie Sirren und leises Klappern eines sich öffnen- 
den Gittertors, Ächzen eines Metallgerüsts, Metalltor leicht scheppernd, Klin- 
geln eines Schlüsselbunds, «Gieren»(= schweizerisch für sehr hohes Quietschen) 
metallisch eines kleinen Wägelchens, Türe hoch quietschend. In all diesen Klang- 


12 «We did a lot of banging on all sorts of metal. The archive building at Skywalker Ranch 
was still under construction - all the girders were exposed. We recorded banging on 
big long girders in various ways so they would really resonate. Imixed to get her dif- 
ferent pitches of metal hits until they were matched and sounded like one metal hit. 
You would get the deep thud with a high ring-out. [...] Everything had to be so much 
bigger than life. Every sound effect in TERMINATOR 2 had to sound like it was injected 
with testosterone, it had to be inflated to unworldly possibilities.» 

13 «This uncertainty is strengthened by the presence of a devil from the future, who is 
apparently not ruled by normal causal laws: he can change shape at will. Teleology and 
calculation presuppose some rules by which one can calculate and interfere with the 
world, but the «Devil seems to be beyond human rules by being beyond physical and 
biological laws.» 
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objekten hat der Sound Designer Gary Rydstrom die unangenehm hohe, 
schrille Komponente mit äußerster Konsequenz herausgearbeitet. Das 
«Gieren» — ein entsprechender Ausdruck scheint in der deutschen Stan- 
dardsprache zu fehlen - wird bereits im Prolog etabliert. In einer nuklea- 
ren Katastrophe im Jahre 2029 geht Los Angeles in Flammen auf. Das 
Kinderlachen auf dem Spielplatz verstummt, zurück bleibt das dünne 
«Gieren» einer verlassenen Schaukel im Wind. Wie wir später erfahren, 
handelt es sich bei diesem Bild um die antizipatorische oder hellseherische 
Vision der Psychiatrie-Insassin, deren Sohn dem Geschlecht der Termina- 
tor entstammt und die Menschheit dereinst retten soll. 


Donner 


Vielleicht ist Donner eher ein Symbol oder ein reiner Klang als ein Material 
im engeren Sinn. Dass er dennoch an dieser Stelle figuriert, ist eine haupt- 
sächlich intuitive Entscheidung, die sich auf jeden Fall mit seiner physika- 
lischen Herkunft rechtfertigen lässt. 

Den Symbolstatus verdankt Donner der besonderen Klanglichkeit: 
Er ist eines der bassigsten und lautesten Klangobjekte, die in der Natur 
überhaupt vorkommen. Wie Lurker (1988: 102) schreibt, galt der Donner 
in sehr unterschiedlichen Kulturen - altorientalischen, griechisch-antiken 
sowie alttestamentarisch-jüdischen — als mahnendes Zeichen des himm- 
lischen Strafgerichts. Für Meyer (1956) ist der Donner ein Grundelement 
furchterfüllter Antizipation eines ungewissen Schicksals. 

Wie der Wind wurde auch das Geräusch des Donners schon früh im 
Theater künstlich erzeugt. Hammerstein (1986: 16 ff.) zitiert aus den Schrif- 
ten Pneumatica und Automata des Heron von Alexandria, der im 1. Jahr- 
hundert vor Christus die Funktionsweisen solcher Klangautomaten und 
ihre Konstruktionsprinzipien beschrieben hat. Im antiken Donnerauto- 
maten fielen Bleikugeln über eine Kaskade von ineinander verschobenen 
hölzernen Hindernissen in einen Hohlraum. 

Auf der filmischen Tonspur ist Donner wegen seiner expressiven 
Symbolik nur in einigen wenigen Kernszenen zu hören - bis Mitte der 
1970er-Jahre außer in CITIZEN KANE (USA 1941, Orson Welles), wo er 
zweimal vorkommt, nur in jeweils einer Szene pro Film. Ab Mitte der 
1970er-Jahre ist gelegentlich - zum Beispiel in der STAR Wars- und der 
INDIANA JoNES-Trilogie, in RAGING BuLL (USA 1980, Martin Scorsese) 
oder Jurassic PARK (USA 1993, Steven Spielberg) — eine signifikante Häu- 
fung von Donner zu beobachten. Diese Tendenz steht in Einklang mit 
einer generellen Verschiebung der Klanglichkeit ins Bassregister, welche 
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unter anderem auf die Erweiterung des Frequenzgangs des Trägermate- 
rials und der Wiedergabeapparaturen in den Kinos zurückgeht (> Bässe 
208). Mit dem Donner verwandt ist das Geräusch eines dumpfen Grol- 
lens, das als unidentifizierbares Klangobjekt über keine bestimmte Quelle 
verfügt. 

Einen gemütlichen Donner gibt es nicht. Ein einziges Mal ist Don- 
ner entfernt in Zusammenhang mit Entspannung zu hören, und zwar in 
Dances WITH Wo vEs (USA 1990, Kevin Costner, 0.35.10-0.35.50), wo er 
einen ruhigen Moment des reflektierenden Nachdenkens tiber vergan- 
gene Ereignisse begleitet. Sonst wird er immer mit unheimlichen Stim- 
mungen, mit Bedrohung und Aggression assoziiert. Wie im richtigen 
Leben kommt Donner überdurchschnittlich häufig zusammen mit Wind 
oder Regen vor. 

In der Star Wars-Trilogie kennzeichnet der Donner im Verbund mit 
einer Reihe bassiger Orientierungslaute das feindliche Empire als prototy- 
pischen Hort des Bösen. 

Donner als Begleitung einer ominösen oder tibernatiirlichen Erschei- 
nung kommt in RAIDERS OF THE Lost Ark (USA 1980, Steven Spielberg) 
gleich mehrmals vor. Im Prolog, der Suche von Dr. Jones nach einem 
Maya-Idol in einer düsteren, unübersichtlichen Höhle in Südamerika, 
wird alles zitiert, was eine unheimliche Stimmung erzeugen kann: 


° Rascheln von Spinnen 

° Tröpfeln 

° dumpfer Knall 

° würgendes Geräusch eines halbverwesten Totenkopfs 
° sausendes Werfen eines Seils 

° Achzen eines belasteten Holzasts 

° verhallter, dumpfer Stockschlag 

e undefinierbares dumpfes Knurren 

° sirrendes Pfeilgeräusch 

e Schritte klackend auf Stein 

° rasselndes Schließen eines schweren Tors 
e Sausen eines Seils 

° dumpfer Schlag 


Der Donner ist nur noch der stereotype Höhepunkt, der Topper. Es gehört 
zur ästhetischen Strategie der Tonsprache in diesen Filmen, die sich expli- 
zit auf die B-Pictures-Abenteuerserien der 1950er-Jahre beziehen, dass 
sie in grotesker Manier Stereotype anhäufen und darüber eine ironische 
Distanz zu ihren Vorbildern, aber auch zum überdrehten Macho-Image 
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ihrer Helden erzeugen. Diese Strategie lässt sich an zahllosen weiteren 
Szenen belegen. Zum Beispiel in INDIANA JONES AND THE LAST CRUSADE 
(USA 1988, Steven Spielberg, 0.43.00-0.52.43), in dem das überzeichnet 
finstere Schloss der ebenso karikiert dämonischen Nazis mit der wieder- 
holten Präsenz dumpfen Donnergrollens verbunden wird. Oder in der 
bereits geschilderten Szene aus RAIDERS OF THE LOST ARK (1.39.40-1.44.30, 
— 346), wenn der Bundeslade unter Donner und Windgeheul der ominös- 
geisterhafte Nebel entströmt. 

Donner, in Verbindung mit anderen fest verankerten Klangobjekten 
des Horror-Genres und unheimlicher Szenen, wird als Stereotyp zum Zei- 
chen des Texts - oder wie im Kapitel Orientierung (> 321) bereits angespr- 
ochen - des Genreswitching. 

Mott beschreibt eine solch stereotype Situation, die bereits im Hör- 
spiel etabliert war: 


Es war eine Sache, in einer Mystery-Sendung im Radio davon zu erzählen, 
wie man sich während einer stürmischen Nacht in einem alten Haus allein 
mit einem geistesgestörten Mörder befindet, aber es war eine ganz andere 
Sache, dies wirklich zu hören: Die Wanduhr, die Mitternacht schlägt, ein 
Donnerschlag, Regen, der gegen ein Fenster prasselt, heulender Wind, Fens- 
terläden, die an die Hauswand klappern, und dann das unmissverständliche 
Geräusch von Schritten, die langsam die knarrende Treppe hochkommen ...'? 

(Mott 1989: 24) 


Es ist eine Frage des Kontexts und des Maßes, ob Donner als stereotypes 
Element der klanglichen Darstellung des Grauens erscheint, wie sie in iro- 
nischer Form von Spielberg zitiert wird. Umso erstaunlicher, dass in der 
gleichen Periode, namentlich zu Beginn der 1990er-Jahre — nach einem 
Jahrzehnt, in dem die überzeichnete Form überwog — Donner auch durch- 
aus ernsthaft in Szenen mit finsterer Grundstimmung auftreten kann. 
Wenn Clarice Starling in THE SILENCE OF THE LAMBs (USA 1991, Jonathan 
Demme, 0.21.31-0.25.40) das düstere Lager des kannibalischen Dr. Lec- 
ter durchsucht und dabei einen in Formaldehyd eingelegten Leichenkopf 
findet, waren eigentlich einige Elemente der distanzierenden Uberzeich- 
nung vorhanden, und trotzdem fehlt alle Komik (> Modellanalyse 429). Als 
Zuschauer teilen wir zu diesem Zeitpunkt die Perspektive Starlings. Der 


14 «It was one thing for radio mystery shows to talk about being alone in an old house 
on a stormy night with an insane killer on the loose, but it was quite another to hear 
what it was like. The mantle clock striking the hour of midnight. A clap of thunder, 
rain beating against the window, a howling wind, shutters banging against the side of 
the house, and then, the unmistakable sound of steps coming slowly up the squeaking 
stairs...» 


Donner 359 


klangliche Kontext bietet nicht nur ein Umfeld von Stereotypen, sondern 
auch einige Geräusche mit authentisch wirkender Materialität, welche die 
physische Anstrengung der Protagonistin unterstreichen, bezeichnender- 
weise vor allem Metallgeräusche. Das Donnern ist nicht comichafter Spe- 
zialeffekt, sondern fügt sich in eine bereits etablierte bassige Klanglichkeit 
ein, die in leitmotivischer Art mit der Erinnerung Starlings an ihr trauma- 
tisches Kindheitserlebnis — die Schlachtung der Lämmer im engeren Sinn, 
der Tod ihres Vaters im Weiteren — verknüpft sind. Das leitmotivische 
Klangobjekt, ein undefinierbares bassiges Sausen, hört sich wie eine Kreu- 
zung aus Wind und Donner an. 

Weiter ist es wohl auch eine Frage des Geschmacks und der media- 
len Abgebrühtheit, ob gefährliche Situationen mit Empathie erlebt oder 
aus ruhiger Distanz belächelt werden. Der Angriff des Tyrannosaurus in 
Jurassic PARK (USA 1993, Steven Spielberg) — der im Dauerregen stattfin- 
det und, von krachendem Donner begleitet, eine apokalyptische Dimen- 
sion entfaltet - kann vielleicht auf beide Arten gelesen werden. Immer- 
hin entbehrt es nicht der Komik, wenn der Dinosaurier ausgerechnet den 
besserwisserischen, unsympathischen Rechtsanwalt direkt von der Klo- 
schüssel weg verschlingt. Das kurze Aufflackern befreiender Schaden- 
freude kann jedoch nicht darüber hinwegtäuschen, dass die Bedrohung 
für die Protagonisten ein existenzielles Maß erreicht, das die Komik wie- 
der zurückdrängt. Insbesondere sensible Naturen — dazu zählt sich die 
Verfasserin dieser Arbeit — werden die lang gezogene Grausamkeit dieser 
Szene kaum ertragen. Auch hier — wie in THE SILENCE OF THE LAMBS - ist 
der klangliche Kontext geprägt von einer außerordentlich taktilen Authen- 
tizität des Materials, auch hier sind es neben den Pfützen und dem Regen 
harte schrille Metallgeräusche sowie das markerschütternde Gebrüll des 
Untiers. Das Auto hingegen, das vor dem Untier schützen sollte, klingt in 
den Klauen des Dinosauriers wie eine leicht zu öffnende Coladose. 

Donner begleitet in JurAssıc PARK außerdem die Expositionsszene 
(0.00.00-0.03.20), in der ein Arbeiter von einem nur in Fragmenten sicht- 
baren Dinosaurier verschlungen wird (> Modellanalyse 414). Auch diese 
Szene wird zusätzlich klanglich charakterisiert durch die undefinierba- 
ren Laute des Tiers, einer Reihe von rasselnden und schrill quietschenden 
Metallgeräuschen und einem durchdringenden Alarm-Buzzer. Das Mus- 
ter, das somit durch die Analyse transparent wird, ist die Assoziation des 
Donners mit dem Tod durch einen angreifenden Dinosaurier. In den einzi- 
gen Szenen, in denen wirklich Menschen zu Opfern werden, ist Donner zu 
hören. Die Angriffe der Dinosaurier erscheinen auf dem Hintergrund von 
Malcolms philosophischen Gedanken über die mangelnde Bescheidenheit 
vor der Natur und die menschliche Hybris, die dem Dinosaurierprojekt 
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zugrunde liegt, als unmittelbare Reaktion der Natur, womit der Donner in 
seiner ursprünglichen symbolischen Bedeutung als göttliches Strafgericht 
gemeint wäre. 


Glas 


Glas spielt vor allem deshalb eine besondere Rolle auf der Tonspur, als 
es bevorzugt dann zu hören ist, wenn es zerstört wird. Etwas überspitzt 
formuliert, könnte man sagen, dass Glas im Film nur dazu da ist, um zu 
zerbrechen. Ausnahmen sind die Gläser in Bars und Restaurants und die 
Flaschen, die polternd auf Theken gestellt werden, um als Orientierungs- 
laut ein Milieu zu zeichnen. 

Glas ist wie die flüssigen Geräusche von Pfützen, Regen und Whisky 
ein klangliches Grundelement im Biopic Brrp (USA 1987, Clint Eastwood). 
Charlie Parker, der geniale Jazzmusiker, dessen sensible Psyche ihn in den 
Niederungen des Lebens scheitern lässt, sucht Zuflucht in Drogen und 
Alkohol. Klingelnde Gläser, Flaschen und Medizinbehälter sind deshalb 
ein Leitmotiv der Sucht. Zerbrechendes Glas wird zu Beginn des Films 
über einen Selbstmordversuch (0.01.50-0.10.35) mit der Todessehnsucht 
assoziiert. Die Sterbeszene am Ende des Films (2.09.04-2.27.43) wird von 
einer düsteren Stimmung mit strömendem Regen und krachendem Don- 
ner eingeleitet. Das zerberstende Glas im Augenblick des Todes ist in eine 
Folge von flash-artigen Rückblenden eingearbeitet, welche als Erinnerun- 
gen das Sterben begleiten. Die bildliche Darstellung unterstützt die beson- 
dere Bedeutung des zerbrechenden Glases: Die Flasche stürzt in Detailauf- 
nahme und Zeitlupe zu Boden. 

Am merkwürdigsten aber ist diese Koinzidenz von zerbrechendem 
Glas und Sterben. Immerhin in einem Fünftel aller Szenen, in denen 
gestorben wird, zerbricht irgendwo - häufig unsichtbar - Glas. Die Grund- 
lage dieser überzufälligen Koinzidenz ist unklar. Die befragten Sound 
Designer konnten keine Auskunft darüber geben, obwohl sie intuitiv 
das Gefühl eines Zusammenhangs hatten. Beggs (1997) erinnerte sich 
an ein persönliches Erlebnis, in dem er wegen eines zerbrochenen Gla- 
ses eine Todesantizipation hatte, die sich zwei Tage später bewahrheitete. 
Es scheint einen auf einem tief verwurzelten, unbewussten Aberglauben 
gründenden Zusammenhang zu geben.” 


15 Plinius (Historia Naturalis IV, 103) berichtet von Bernsteininseln namens Glesiae, die 
in der Nordsee lagen und einerseits an die altnordischen Glaesisvellir erinnern, an die 
glänzenden Gefilde im paradiesartigen Jenseits, andererseits aber auch an die Glas- 
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Alle Vermutungen und historischen Herleitungen bleiben spekula- 
tiv. Mit anderen Worten besteht ein Erklärungsnotstand, der typisch für 
die Beschäftigung mit der sekundären Bedeutung von Materialien ist: Auf 
der einen Seite steht ein Phänomen, das tatsächlich beobachtet, also empi- 
risch belegt werden kann, auf der anderen Seite fehlen wissenschaftlich 
fundierte Herleitungen der semantischen oder symbolischen Basis. Unter 
anderem ist Glas nicht nur ein sanft klingendes weibliches Material, wie 
Schafer (1977: 163) meint, sondern in zerbrochener Form ein ebenso scharf- 
kantiges, aggressives Material, das instinktiv zurückschrecken lässt. Die- 
ser Aspekt wird zum Beispiel deutlich, wenn in Actionszenen die Feinde 
obligatorisch in Fensterscheiben fallen, wenn bei Schusswechseln im Hin- 
tergrund eine Scheibe zerbersten muss oder bei Auto-Crashs mit kurzer 
zeitlicher Versetzung Glas klirrt. Alle diese Situationen sprechen diese 
innere Referenz des Materials an. 


berge europäischer Volksmärchen, die von manchen Forschern (so schon von Jakob 
Grimm) als Totenberge erkannt wurden (Lurker 1988: 243). 


12 Subjektivierungen 


Techniken zur Markierung subjektiv gefärbter Wahrnehmungsformen 
haben seit den frühesten Tagen des Films Eingang in die Erzählweise 
gefunden. Wie Gaudreault/Jost (1990: 137) schreiben, waren es nicht nur 
die Repräsentation des Blickpunkts einer Figur, der Point of View Shot 
(PoV), sondern auch andere Spielarten von subjektiv transformierten 
Wahrnehmungen wie Träume, Halluzinationen, Erinnerungen oder Visio- 
nen, die über Doppelbelichtungen, Schwarzblenden oder andere Formen 
der auffälligen Verfremdung markiert wurden. Münsterberg postulierte 
in seiner psychologisch fundierten Studie The Photoplay bereits 1916, dass 
die narrative Struktur des Films sich an psychisch-mentalen Prozessen der 
Wahrnehmung und der Aufmerksamkeit orientiere. Er vertrat einen kons- 
truktivistischen Ansatz der Wahrnehmung, wie er später unter anderem 
von Piaget entwickelt wurde. Ausgehend von diesem Ansatz kam Müns- 
terberg zum Schluss, dass die filmische Narration mit den Mitteln von 
optischer Repräsentation und Montage subjektive Wahrnehmungsstrate- 
gien «durch Verlagerung der Aufmerksamkeit, Aktivieren von Gedächt- 
nisinhalten, Bildung von Hypothesen [...] unter Einbezug von Gefühls- 
empfindungen aufgreife» (Brütsch 1999: 3). 

Nach dem Ersten Weltkrieg nahmen subjektiv motivierte Darstel- 
lungsformen exponentiell zu, in avantgardistischen Strömungen wie dem 
deutschen Expressionismus - unter anderem mit Wienes Das CABINET 
DES DR. CALIGARI (Deutschland 1919) oder den frühen Werken von Fritz 
Lang - sowie in der französischen Avantgarde, die unter dem Begriff 
Impressionismus zusammengefasst wird. Die avantgardistischen Techni- 
ken, die von Abel Gance, Germaine Dulac, Jean Epstein und anderen ent- 
wickelt wurden, um eine subjektivierte Weltsicht auszudrücken, hatten 
einen nachhaltigen Einfluss auf das filmgestalterische Repertoire späterer 
Generationen, insbesondere auch auf bedeutende Exponenten des Main- 
streamfilms. 

Einen solchen Einfluss macht Weis (1985: 302 ff.) beispielsweise für 
das Werk Alfred Hitchcocks geltend. Besonders in den 1940er- und 1950er- 
Jahren zentrieren sich ganze Filme um die verzerrte Wahrnehmung einer 
Figur, ohne dieser subjektiven Sichtweise eine faktisch anmutende Alter- 
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native gegentiberzustellen. Besonders modellhaft erscheint diese Strate- 
gie laut Weis in REBECCA (USA 1940), Suspicion (USA 1941) und REAR 
Window (USA 1954). In ihrer Analyse zu formalen Aspekten der Subjek- 
tivierung in REBECCA stellt Brinckmann (1981: 104) dar, wie Hitchcock mit 
wenigen Eingriffen dem Ganzen ein Flair von Subjektivität und Erinnerung 


gibt. 


Außerdem achtet Hitchcock darauf, dass fast alle Handlung in Gegenwart 
der Hauptperson stattfindet, dass alle Ereignisse auf sie bezogen sind und 
ihren Sinn aus der Bedeutung herleiten, die sie für sie haben. So ist REBECCA 
zwar konventionell erzählt, wenn man vom Anfang absieht, erreicht aber 
eine derart intensive Fixierung auf die Hauptperson, dass sie als Ichfigur 
empfunden wird. (Brinckmann 1981: 104) 


Hitchcock war denn auch einer der Ersten, die für die Darstellung subjek- 
tiver Wahrnehmung auf der Tonspur griffige Formeln fanden. Bereits in 
seinem ersten Tonfilm BLACKMAIL (GB 1929) beschränkte er sich nicht auf 
optische Strategien, um den psychischen Extremzustand der Protagonistin 
darzustellen. 

Es ist kein Zufall, dass mit dem Film noir eine zweite Welle subjekti- 
ver Erzählstrategien — gekoppelt an eine expressive Kameraführung und 
komplexe Rückblendenstrukturen - während des Zweiten Weltkriegs auf- 
trat. Vielmehr drückt sich darin die Tendenz aus, extreme existenzielle 
Erfahrungen, in denen das Subjekt auf sich selber zurückgeworfen wird, 
in einer Transformation stilistischer Strategien weg von kanonisierten 
Erzählformen hin zu fragmentierten Auflösungen des Erzählstroms zu 
äußern. Allerdings ist der Film noir innerhalb des amerikanischen Nach- 
kriegsfilms die ästhetische Manifestation einer Splittergruppe, die mit kei- 
ner generellen Veränderung des stilistischen Repertoires einhergeht. 

Im Korpus dieser Arbeit fehlen diese Filme völlig, weil bei dessen 
Konzeption die Veränderungen des Mainstreamfilms im Vordergrund 
standen. Die Mehrzahl der als Film noir bezeichneten Werke entstanden 
als B-Pictures, als billige Parallelproduktionen der Studios, und wurden 
deshalb nicht für Oscar-würdig befunden. Es zeigte sich deshalb bei der 
Analyse des Korpus ein verzerrtes Bild, das ich durch die Visionierung 
einiger spezifisch subjektivierter Werke aus der Film noir-Serie zu mil- 
dern versuchte. Namentlich die Filme STRANGER ON THE THIRD FLOOR 
(USA 1940, Boris Ingster), ACT OF VIOLENCE (USA 1949, Fred Zinnemann), 
MURDER, My Sweet (USA 1944, Edward Dmytryk, auch nach der Roman- 
vorlage von Raymond Chandler FAREWELL, My LovELy genannt) und A 
DouBLE Lire (USA 1947, George Cukor) operieren mit einer Reihe von 
bemerkenswerten Subjektivierungsstrategien. Wie bei Hitchcock ist auch 
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in diesen Werken der Einfluss avantgardistischer Techniken vom expres- 
sionistisch überhöhten Schattenwurf über Mehrfachbelichtungen bis hin 
zur entfesselten Kamera im Stil des französischen Impressionismus deut- 
lich spürbar. Mehr noch wirkt der Film noir formal sehr heterogen. «Da 
ihm die ästhetische Innovation nicht offizielles Programm war, sondern 
eher unter der Hand, individualistisch und unter je verschiedenen Bedin- 
gungen gelang, erreicht sie selten eine konsistente Glätte — und gerade in 
dieser Inkonsistenz liegt ein besonderer, sehr modern anmutender Reiz» 
(Brinckmann 1981: 97). Das experimentierfreudige Spiel mit Verfremdun- 
gen wird jedoch vorwiegend über die optische Transformation ausgelebt. 
Auf der Tonspur, die sich hier mehrheitlich auf die Ausdruckskraft von 
Musik und Sprache stützt, sind verfremdete Geräusche wie auch Orien- 
tierungslaute oder materielle Ausgestaltungen von Klangobjekten äußerst 
selten. Ein besonderes Augenmerk wird auf die Voiceover-Narration gelegt 
(Brinckmann 1985: 115 ff.), die sich als zweite Schiene parallel zur bildhaf- 
ten Erzählung entwickelt und das Vehikel par excellence zur Kommuni- 
kation von Gedanken, Gefühlen und weiteren inneren Zuständen bildet. 
Die Erzählerstimmen haben dabei nicht nur die Funktion, die Innenwelt 
sprachlich zu kommunizieren, sondern sie bilden gleichzeitig einen eige- 
nen Klangteppich, der unterschwellig über die prosodischen Merkmale 
Rhythmus und Intonation sowie die klanglichen Charakteristika der 
Stimme einen emotionalen Appell formulieren. 

Im Mainstreamfilm, wie er sich im ausgewählten Korpus präsentiert, 
folgt nach ersten Versuchen der klanglichen Repräsentation von auditi- 
ven Wahrnehmungen zu Beginn der Tonfilmzeit — unter anderem in den 
europäischen Filmen BLACKMAIL und M — EINE STADT SUCHT EINEN MÖR- 
DER (Deutschland 1931, Fritz Lang) — eine Phase der Dürre. In den 1930er-, 
1940er-Jahren wurden außerhalb des Film noir nur selten Wahrnehmungs- 
formen von Figuren in kreative stilistische Konzepte übersetzt, unter ande- 
rem in THE HURRICANE (USA 1937, John Ford), wo die Südseeinsulanerin 
Marama die bevorstehende Naturkatastrophe in einem Traum antizipiert. 
Namentlich ist es jedoch CITIZEN KANE (USA 1941, Orson Welles), dessen 
komplexe Erzählstruktur keiner regelhaften Dramaturgie folgt, sondern 
verschiedene Erinnerungen facettenreich in Beziehung zueinander setzt, 
ohne ihre Widersprüchlichkeit einer übergeordneten auktorialen Aussage 
zu opfern. Ende der 1940er-Jahre sind es THE SNAKE Pir (USA 1948, Ana- 
tole Litvak) und TwELvE O’CLock HıcH (USA 1949, Henry King), zwei 
Filme, die in dieser Arbeit aufgrund anderer stilistischer Besonderheiten 
bereits mehrfach erwähnt wurden: Beide Filme stellen das Verhalten ihrer 
Protagonisten aus einer mehr oder weniger expliziten psychologischen 
Perspektive dar. In THE SNAKE Prt bilden die Erinnerungen der psychisch 
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labilen Protagonistin an traumatische Kindheitserlebnisse den Schliissel 
zur Heilung ihrer Krankheit. Außerdem bietet die Krankheit selbst den 
Grund für eine Reihe weiterer Subjektivierungen. In TwELvE O’CLOcK 
HIGH sind es die destruktiven Auswirkungen der Kriegserfahrung, die 
psychische und physische Erschöpfung, die zu einer Verschiebung der 
Erzählperspektive führen. 

In den 1960er-Jahren sind im Korpus ebenfalls vereinzelte Beispiele 
zu finden: der bereits diskutierte LAWRENCE OF ARABIA, in dem die latente 
Subjektivierungstendenz in das Umfeld einiger weniger expliziter Per- 
spektivverschiebungen gestellt wird; John Frankenheimers experimentell 
getönter GRAND Prix (USA 1966), in dem eine einheitliche, durchgehende 
Handlung sich völlig in stilistische Extremformen auflöst, von zeitlichen 
Verfremdungen wie Zeitraffer und Zeitlupe, grafischen Elementen wie 
Splitscreen und weiteren ungewöhnlichen optischen Special Effects bis hin 
zu seriell angeordneten Schnittfolgen einzelner Vorgänge aus verschiede- 
nen Perspektiven. 

Jaws (USA 1975, Steven Spielberg) markiert innerhalb des Korpus 
den Beginn einer signifikanten Zunahme von Subjektivierungsstrategien, 
die sich vor allem auch in akustischen Transformationen äußern, was im 
Hinblick auf das Thema dieser Arbeit besonders bedeutsam erscheint. 
Als Höhepunkt dieser Tendenz schälen sich die Filme RAcınc Buti (USA 
1980, Martin Scorsese) und RUMBLE Fisu (USA 1983, Francis Ford Cop- 
pola) heraus, die fast durchgängig aus der Perspektive einer oder mehre- 
rer Figuren erzählt werden und über vorbildhaft reichhaltige Tonspuren 
verfügen. 

Diese Zunahme geht ebenfalls auf die Einverleibung experimen- 
teller Techniken zurück, eine These, die sich mit meinen Überlegungen 
zur Genese der New-Hollywood-Bewegung deckt (> Einleitung 13). Die 
Spuren dieses Einflusses werden in einer Reihe von technischen Ein- 
griffen in einen als natürlich etablierten Formenkatalog des klassischen 
Hollywood-Repertoires sichtbar: Schockhafte Umschnitte, ungewöhnli- 
che Kamerastandpunkte und exzessive Kamerabewegungen, rätselhafte 
Szenenübergänge, die den Zuschauer zu permanenter Interpretationstä- 
tigkeit zwingen, sowie Unter- und Überbelichtungen treten an die Stelle 
des wohldosierten, primär um Verständlichkeit bemühten Kommunika- 
tionsflusses des klassischen Stils. Die Feier der Reizdimension an sich, mit 
deren klanglichen Aspekten ich mich bereits mehrfach auseinandergesetzt 
habe, sprengt den Rahmen einer eindeutig zu definierenden Erzählper- 
spektive. Vielmehr wird der Zuschauer mit einer allumfassenden Ambi- 
valenz konfrontiert, die sich speziell auch für die Diskussion der Subjek- 
tivierung eignet, deren Theorien im Folgenden behandelt werden. Metz 
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(1991: 132) jedenfalls kritisiert die zeitgenössische Mainstream-Asthetik 
als sinnloses Jahrmarktspektakel, als nur vage kognitiv konzipierte Pyro- 
technik. 

Ob tatsächlich die Freiheit der Indifferenz die Gestaltung des neueren 
Mainstreamfilms dominiert, wie Metz (1991: 132) weiter ausführt, oder 
ob sich allenfalls doch Konzepte, Strukturen oder Strategien feststellen 
lassen, die mit der Aussage interagieren — diese Frage wird die konkrete 
Betrachtung einiger Fälle begleiten. Zunächst geht es darum, den reichhal- 
tigen theoretischen Hintergrund für die adäquate Diskussion dieses Sach- 
verhalts aufzuarbeiten. 


Theoretische Grundlagen 


Im Gegensatz zu den meisten Gegenstandsbereichen dieser Arbeit ist der 
Komplex Subjektivierung in der Filmtheorie sehr gut erschlossen.'! Es las- 
sen sich zwei Haupttendenzen der theoretischen Auseinandersetzung mit 
dem Thema isolieren: die Apparatus-Theorie, die ihren Ursprung in der 
ideologiekritischen Analyse der Maschine Kino hat, und die narratologi- 
schen Konzepte der Blickpunkt-Theorie, die sich mit der Konstruktion des 
Blickpunkts durch die erzählerische Strategie des filmischen Texts ausei- 
nandersetzt. 

In der Umgangssprache ist der Begriff Blickpunkt (Point of View) mit 
einer gewissen Unschärfe auf zwei Ebenen gebräuchlich: 


a) wörtlich als Bezeichnung des Ortes, von dem ausgeblickt wird (physi- 
scher Standpunkt) 

b) in der metaphorischen Bedeutung als Geisteshaltung, von dem aus ge- 
blickt wird (mentaler Blickpunkt) 


Diese Unschärfe durchzieht auch die Begriffsbestimmung in der neueren 
Filmtheorie. Entsprechend der Mehrfachcodierung des Films existieren 
verschiedene Blickpunkte: 


1. die perspektivische Organisation der einzelnen Einstellung 
2. die raumzeitliche Organisation der verschiedenen Einstellungen 


1 Einen Überblick über verschiedene Konzepte bietet Robert Stam / Robert Burgoyne / 
Sandy Flitterman-Lewis (1992): New Vocabularies in Film Semiotics. Structuralism, Post- 
Structuralism, and Beyond. 

Klassische Überlegungen zur Darstellung subjektiver Wahrnehmungsformen finden 
sich außer in Hugo Münsterbergs The Photoplay (1916) auch bei Baläzs (1930, 1949) und 
in Kracauers Theory of Film (1960). 
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3. der narrative Fluss, welcher von einer übergeordneten Erzählinstanz 
kontrolliert wird 
4. die Sicht- und Wahrnehmungsweise der Figuren 


Diese Blickpunkte überschneiden sich teilweise oder ergänzen einander. 


Der Blickpunkt in der Apparatus-Theorie 


Die Apparatus-Theoretiker befassen sich mit den ideologischen Implika- 
tionen der Zuschauerpositionierung durch die Maschine Kino. Um die 
Frage zu beantworten, inwiefern der Prozess der Umformung durch Auf- 
nahme und Wiedergabe die Wahrnehmung der Zuschauer bestimmt, hat 
zuerst Baudry (1970) die These aufgestellt, dass dem materiellen Blick- 
punkt auch ein psychologischer oder kognitiver Blickpunkt im metapho- 
rischen Sinn entspreche. 

Die Fluchtlinien der Bildperspektive definieren einen eindeutigen 
Ort außerhalb des Bildes, von dem aus ein hypothetischer Betrachter die- 
ses Bild sehen würde. Gleichzeitig organisieren diese Fluchtlinien den 
repräsentierten Raum hierarchisch, indem im Vordergrund stehende Per- 
sonen und Objekte privilegiert werden. 

Der Zuschauer im Kino befindet sich gemäß diesen Überlegungen 
ungefähr da, wo sich bei der Aufnahme die Kamera befunden hat. Auf- 
grund dieser Positionierung, so Baudry (1970), zwinge uns das Bild, unge- 
achtet seines Inhalts, die Idee eines hierarchisch strukturierten Univer- 
sums auf. Diese Botschaft sei nicht nur im einzelnen Bild präsent, sondern 
werde durch die Montage untermauert, die trotz der diskontinuierlichen 
Elemente — den einzelnen Einstellungen - eine Kontinuität suggeriere und 
damit die Unterschiede auslösche. Die Gleichstellung von räumlicher und 
ideologischer Positionierung hatte ihren Ursprung in der materialisti- 
schen, an marxistischem Gedankengut orientierten philosophischen Posi- 
tion Althussers (1970), der postulierte, dass die Ideologie in die Handlun- 
gen der Praxis eingeschrieben sei und über die Analyse der Praxis für den 
kritischen Diskurs zurückgewonnen werden müsse. 

Diese Überlegungen sind jedoch so stark am Bild orientiert, dass sie 
sich nicht ohne Weiteres auf die Tonspur übertragen lassen. Zwar hatte 
Michel Chion 1985 in Analogie zum Blickpunkt den Begriff Hörpunkt (point 
d’écoute) etabliert, in L’Audio-vision (1990: 79) jedoch zu Recht infrage 
gestellt. 

Die Fragwürdigkeit des Begriffs Hörpunkt geht laut Chion einerseits 
aus der oben angesprochenen Unschärfe zwischen manifester Raum- 
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position und metaphorischer Bedeutung, andererseits aus spezifischen 
Eigenheiten der Schallausbreitung und des Hörens hervor. Ein akusti- 
sches Ereignis besteht mehrheitlich nicht nur aus dem direkten Schall, 
sondern auch aus verschiedenartigen Reflexionen und Beugungen, wel- 
che der umgebende Raum verursacht. Ist die Situation im Hinblick auf 
ein einzelnes Klangobjekt noch einfach, wird sie mit zunehmender Anzahl 
komplizierter. Leisere Klangobjekte im Vordergrund können durch lau- 
tere Ereignisseim Hintergrund bis zur Unkenntlichkeit maskiert werden. 
Außerdem kommt es zu einer Vielzahl hoch komplexer Verschmelzungs- 
prozesse sowohl durch physikalische Eigenschaften des Schalls wie auch 
durch Transformationen des auditiven Apparats. Weiter wird die auditive 
Wahrnehmungsperspektive dadurch geprägt, dass der Hörraum immer 
den gesamten Radius von 360° umfasst. Dadurch ordnen sich die Klang- 
elemente kreisförmig um den Kopf des Hörers an. Zwar ist die Fähigkeit 
zur Ortung in der Blickrichtung am besten, dennoch nimmt man axial 
positionierte Schallereignisse nicht bevorzugt wahr. Als essenzielle Para- 
meter zur hierarchischen Schichtung von Lautsphären sind neben der 
Lautstärke zahlreiche andere Verfahren der Aufmerksamkeitssteuerung 
und Selektion zu verstehen, die ausführlich behandelt wurden (— 253) 
und die untrennbar mit psychischen Prozessen der individuellen Wertung 
gekoppelt sind. 

Seit die Technik des Stereotons das Kino erobert hat und seit diverse 
Methoden der künstlichen Raumsimulation jedes Klangereignis mit eige- 
nen, vom tatsächlichen Raum unabhängigen Raumparametern ausstatten, 
ist es unmöglich geworden, einen singulären Hörpunkt im räumlichen 
Sinn auszumachen. 

Die Abbildungsmechanismen der Tonprozessierung habe ich im 
Kapitel Abbildung (> 69) bereits ausführlich beschrieben und dort fest- 
gestellt, dass die Unterschiede zwischen Mikrofon und Kamera sehr groß 
sind. Die Raumeigenschaften schreiben sich in der Tonaufnahme nicht in 
derselben bestimmenden Weise ein, wie dies bei der Bildaufnahme durch 
die Perspektivlinien geschieht. Auch ich als Profi höre aus einer Aufnahme 
nicht heraus, wo sich das Mikrofon befunden hat. Anhand des Materials 
lässt sich nur bestimmen, wie nah oder fern, wie trocken oder räumlich 
die Aufnahme wirkt. Dieses Urteil wird sich hauptsächlich an der Sprach- 
aufnahme orientieren. Die Tonspur ist jedoch eine komplexe Struktur ver- 
schiedener Elemente, und jedes dieser Elemente hat eine Quelle, jede Auf- 
nahme einen Hörpunkt, der sich zudem ständig ändern kann, auch wenn 
das Bild stabil bleibt. 

Die Praxis, Sprache und Geräusche zunächst sehr präsent aufzu- 
nehmen und erst in der Mischung wieder mit Rauminformation aufzu- 
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laden, bedeutet eine standige Bewegung des Mikrofons im profilmischen 
Raum. Oder anders ausgedrückt: Blickpunkt und Hörpunkt entspre- 
chen einander keineswegs, sondern werden in Abhängigkeit von situ- 
ativen Überlegungen in Beziehung zueinander gesetzt. Wenn man als 
Tonmeister dennoch darauf achtet, eine kohärente Illusion herzustellen, 
so ist diese Kohärenz nicht materiell determiniert, wie dies auf der Seite 
des Bildes durch den Kamerastandpunkt geschieht, sondern es ist eine 
genau austarierte Mischung verschiedener Informationen, von denen 
jeweils ein Bündel via Lautstärke oder klangliche Dominanz so in den 
Vordergrund geschoben wird, dass der Rezipient sein Hören mit großer 
Wahrscheinlichkeit darauf fokussiert. Die Tonspur imitiert die Selek- 
tionsmechanismen, die man auch im Alltag benutzt, um komplexe Reize 
kognitiv zu verarbeiten. Dies geschieht in Kenntnis der psychoakusti- 
schen Mechanismen wie der Entscheidungs- und Selektionsroutinen, 
die unter dem Stichwort Streaming (> 253) behandelt wurden. Darum 
ist die Tonspur in ideologischer Hinsicht keineswegs so unschuldig, wie 
das Fehlen eines bestimmten Hörpunkts vermuten lässt, der dem Blick- 
punkt entspricht. Auch sie präsentiert das Material in einer hierarchisch 
strukturierten Weise, die den Zuschauer in seiner Wahrnehmung posi- 
tioniert. 

Auf keinen Fall gehe ich jedoch mit Altman einig, der behauptet: 
«Wir sollen nicht selbst hören, sondern uns mit jemandem identifizieren, 
der für uns hört» (1992: 61).” Dieser Ansatz mag für das Bild stimmen, in 
welchem eine Kameraposition einen Blick vertritt und uns diesen Blick 
aufzwingt. Die Tonspur hingegen ist immer als Gesamtarchitektur prä- 
sent, der subjektive Ton lediglich ein Element derselben. Im zeitgenös- 
sischen Film lässt sich deshalb keine so eindeutige perspektivische Linie 
finden. Solche Experimente gehören der Vergangenheit an. Die einzige 
Möglichkeit einer eindeutig subjektiven Positionierung, die mir heute 
noch denkbar erscheint, ist die Stille, wie sie beispielsweise in ALL THAT 
Jazz von Bob Fosse (USA 1981) den Tod symbolisiert (> Stille 234), oder 
das Verschwindender Geräusche, das in einem eigenen Abschnitt bespro- 
chen wird (> 397). 

Alle anderen Strategien der Subjektivierung betreffen immer nur 
Teile der Tonspur, denn als Stereo den Film eroberte, löste sich die starre 
Tonperspektive auf. An die Stelle eines klar definierten Hörpunkts, wel- 
cher die Perspektive auf einer Achse vertikal zur Leinwand organisierte, 
trat eine Vielzahl von denkbaren Hörpunkten, die alle potenziell Trä- 
ger einer latent oder manifest subjektivierten Wahrnehmung sein kön- 


2 «Weare asked not to hear, but to identify with someone who will hear for us.» 
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nen. Mit der latenten Subjektivierung, welche die Orientierungsfunktion 
und die Klanglichkeit der Materialien bestimmt, nahmen verschiedene 
andere Subjektivierungsstrategien auf der Tonspur zu. Die überbordend 
befrachteten Tonspuren namentlich des zeitgenössischen Mainstream- 
films belegen mehrere auditive Wahrnehmungsschichten gleichzeitig. 
Wegen der begrenzten Kapazität des neuronalen Systems kann man nur 
einen Bruchteil der tatsächlich vorhandenen Information bewusst ver- 
arbeiten. Ein Großteil der Wahrnehmungsinhalte schlüpft unbemerkt 
in die Rezeption und entfaltet sich dort als unterschwellige, emotional 
gefärbte Botschaft. 

Die Frage der Identifikation erscheint mir grundsätzlich als sehr 
heikel. Ich bezweifle, dass es objektive, absolute Kriterien gibt, wel- 
che mit Sicherheit die Mechanismen herausschälen können, die unsere 
Identifikation erklären. Besonders problematisch erscheint mir jedoch 
das Postulat einer eindeutigen Positionierung der Rezipienten durch 
die Tonspur, wie es bei Altman, aber auch in der früheren Publikation 
von Chion (1985) aufscheint. Im Kino konzentrieren wir unsere auditive 
Wahrnehmung auf die akustischen Informationen, die von der Leinwand 
zu kommen scheinen oder sich über die Lautstärke in den Vordergrund 
schieben, während uns Klangobjekte und Raumindikatoren von allen 
Seiten umfluten, die wir nur sekundär oder überhaupt nicht kognitiv auf- 
schlüsseln. 


Narratologische Konzepte 


Die Vorstellung einer aktiven Rezipiententätigkeit, eines Dialogs des 
Zuschauers mit dem filmischen Werk, unterscheidet den narratologischen 
Ansatz von der Apparatus-Theorie, in der die Kinosituation unsere Wahr- 
nehmung bestimmt. Zuerst hatte Browne (1975) anhand einer Szene aus 
John Fords STAGECOAcH (USA 1939) analysiert, wie der Film als rhetori- 
sches System einen textimmanenten Blickpunkt generiert, der sich vom 
Kamerastandpunkt unterscheidet. Diesen Gedanken haben einige Film- 
theoretiker wie Branigan (1984 und 1992), Bordwell (1985) oder Chatman 
(1990), aber auch Metz (1991) weitergeführt. Die französischen Poststruk- 
turalisten, vor allem Roland Barthes (1970 und 1985) und Gérard Genette 
(1972 und 1983), haben einen entscheidenden Einfluss auf die Analyse des 
Films als Text ausgeiibt. 

Alle narratologischen Ansätze gründen auf einer zwei- oder dreistu- 
figen Unterscheidung zwischen dem formalen, strukturellen Aufbau des 
Materials, wie es der Erzähler präsentiert (syuzhet, plot), und dem logisch- 
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kausalistischen, temporal geordneten Destillat, das der Zuschauer oder 
Leser während der Rezeption herstellt (fabula, story).? Indem die klassische 
filmische Narration ihre Erzählinstanz sorgfältig maskiert, gibt sie dem 
Zuschauer die Möglichkeit, eigene Verbindungen zur Diegese zu schaffen, 
vermittelt ihm das Gefühl, selbst Urheber der fantasierten Welt zu sein 
(Stam et al. 1992: 106). 


Fokalisierung 


Der französische Literaturwissenschaftler Gerard Genette hat in Figures III 
(1972) und Nouveau discours du récit (1983) ein exaktes Modell zur Beschrei- 
bung von narrativen Strukturen und Funktionsweisen entworfen. Unter 
dem Begriff Fokalisierung* (focalisation) hat er 1972 eine Größe eingeführt, 
welche - ausgehend von der Frage wer nimmt wahr? — den kognitiven 
Blickpunkt eines Textes bestimmt: 


Unter Fokalisierung verstehe ich also eine Einschränkung des Feldes, d.h. 
eine Selektion der Information gegenüber dem, was die Tradition Allwissen- 
heit nannte, ein Ausdruck, der - wörtlich genommen - im Bereich der Fiktion 
absurd ist (der Autor braucht nichts zu «wissen», da er alles erfindet) und 
den man besser ersetzen sollte durch vollständige Information — durch deren 
Besitz dann der Leser «allwissend» wird. Das Instrument dieser (eventuel- 
len) Selektion ist ein positionierter Fokus, das heißt eine Informationsschleu- 
se, die nur durchlässt, was die Situation erlaubt.’ (Genette 1983: 49) 


Die Fokalisierung ist in Genettes ursprünglichem Verständnis eine Rege- 
lung des Informationsflusses. Einige Aspekte einer potenziell vollstän- 
digen Information werden unterdrückt, während andere im Hinblick 


3 Ein solches zweistufiges Modell beschreibt zum Beispiel David Bordwells Narration 
in the Fiction Film (1985, besonders S. 49 ff.). Bordwell setzt sich aus einer neoformalis- 
tischen Perspektive mit der kognitiven Interpretationstätigkeit des Zuschauers ausei- 
nander. Focalisation wird in der deutschen Ausgabe von Genettes Discours du recit und 
Nouveau discours du recit mit dem Titel Die Erzählung (München 1994: Wilhelm Fink Ver- 
lag) als Fokalisierung übersetzt. 

4 Focalisation wird in der deutschen Ausgabe von Genettes Discours du récit und Nouveau 
discours du recit mit dem Titel Die Erzählung (München 1994: Wilhelm Fink Verlag) als 
Fokalisierung übersetzt. 

5 «Parfocalisation j'entends donc bien une restriction de champ, c'est-à-dire en fait une 
sélection de l'information par rapport à ce que la tradition nommait l’omniscience, 
terme qui, en fiction pure, est, littéralement, absurde (l'auteur n’a rien a «savoir», 
puisqu’il invente tout) et qu'il vaudrait mieux remplacer par information complète — 
muni de quoi c'est le lecteur qui devient «omniscient». L'instrument de cette (éven- 
tuelle) sélection est un foyer (= engl. focus) situé, c'est à dire une sorte de goulot d’in- 
formation, qui ne laisse passer que ce qu’autorise la situation.» 
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auf die subjektive Bedeutsamkeit einer oder mehrerer Figuren betont 
werden. 

Damit baut Genette ein Modell aus, das Tsvetan Todorov (1966) ent- 
wickelt hat. Dieses Modell illustriert das Basiskonzept der Fokalisierung 
in vereinfachter Form: 


e Erzähler > Figur: Der Erzähler verrät mehr, als die Figuren wissen 
können 

e Erzähler = Figur: Der Erzähler sagt nur, was die Figur auch weiß 

e Erzähler < Figur: Der Erzähler gibt nicht alles preis, was die Figur weiß 


Im Grunde genommen illustriert das Modell vor allem die Relation zwi- 
schen optimalem und eingeschränktem Informationsfluss, die Genette in 
seiner neuen Definition auch hervorhebt. Unter dem Oberbegriff Fokalisie- 
rung unterscheidet Genette folgende Abstufungen: 


e Null-Fokalisierung: bezeichnet eine übergeordnete Perspektive, den 
Blick von Gott oder von Sirius, jedenfalls weit entfernt von der 
Dieges. 

° Interne Fokalisierung: Die Diegese wird durch die Wahrnehmung einer 
Figur geschildert. Sie ist fixiert, wenn die ganze Erzählung aus der 
Perspektive einer einzigen Person erfolgt (wie in LADy IN THE LAKE, 
USA 1946, Robert Montgomery), variabel, wenn die Perspektive im Lauf 
der Erzählung auf verschiedene Figuren verteilt wird (wie in CITIZEN 
KANE, USA 1941, Orson Welles); oder multipel, wenn das gleiche Ereig- 
nis aus verschiedenen Perspektiven geschildert wird (wie in RasHo- 
Mon, Japan 1950, Akira Kurosawa, oder im Briefroman Les Liaisons 
dangereuses von Choderlos de Laclos). 

e Externe Fokalisierung: Der Fokus befindet sich innerhalb der Diegese, 
aber außerhalb aller Figuren. Wir schauen mit der Figur, aber wir ken- 
nen ihre Gedanken nicht, im Gegensatz zur internen Fokalisierung. 


Dieses Konzept ist bezogen auf die Literatur, zu deren Analyse es 
ursprünglich bestimmt war, sehr einleuchtend und hilfreich. Seine Über- 
tragung auf den Film ist jedoch wesentlich komplexer, als man auf den 
ersten Blick meinen könnte. Die spezifische Problematik rührt grund- 


6 Mit den Unterschieden zwischen Film und Roman haben sich zahlreiche Theoretiker 
befasst. Vgl. dazu Brinckmann (1981): Ichfilm und Ichroman, die sich speziell mit der 
Zuschreibung der filmischen Narration zu einer subjektiven Erzählinstanz auseinan- 
dersetzt. 
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sätzlich von zwei Unterschieden her: Zum einen fehlt im Film — abgese- 
hen von der Voiceover-Narration — ein grammatikalischer Marker, der den 
Urheber einer Erzählung klar definiert; zum anderen verfügt der Film, wie 
eingangs erwähnt (> 366), über eine Vielzahl von Blickpunkten, die sich 
decken können oder auch nicht. Dieses Grundproblem hat bei verschiede- 
nen Autoren zu unterschiedlichen Lösungen geführt. 

Von Bedeutung für das Thema Blickpunkt/Hörpunkt der filmischen 
Erzählung ist jedenfalls der ausdrückliche Hinweis Genettes, dass es sich 
bei der Fokalisierung um einen perzeptiven Standpunkt handelt. Tat- 
sächlich geht es ja darum, dass im Film drei Schichten der Informations- 
vermittlung unterschieden werden können: der narrative Kontext, der 
gewisse psychische Dispositionen, Urteile oder Antizipationen nahelegt; 
der Bildausschnitt, der die Perspektive der Kamera repräsentiert; die Auf- 
bereitung des akustischen Umfelds. Jede dieser Schichten verfügt poten- 
ziell über eine subjektivierbare Perspektive. Diese Perspektiven können 
natürlich auch zusammenfallen und tun es in der Literatur und im Film 
auch häufig. In Fragen übersetzt, heißt das: Wer erzählt, wer hört, wer 
sieht? 


Terminologie zu einem dreistufigen Modell der 
filmischen Fokalisierung 


Zuerst hat sich Francois Jost (1983) mit der Anwendung des Konzepts 
Fokalisierung in der Filmanalyse beschäftigt. Er hat ein dreistufiges Modell 
entworfen, das die Unterscheidung zwischen dem erzählerischen, dem 
optischen und dem akustischen Blickpunkt berücksichtigt, welche durch 
die spezifisch filmische Mehrfachcodierung zustande kommt. Ich stütze 
mich bei der folgenden Darstellung auf die Publikation von Gaudreault/ 
Jost (1990: 130 ff.), welche die ersten Überlegungen Josts vertieft. 

Der Terminus interne Fokalisierung bleibt in diesem Modell dem men- 
talen Blickpunkt vorbehalten. Mit dem Begriff Okularisierung (ocularisa- 
tion) erfassen die Autoren den optischen Blickpunkt. Die Okularisierung 
beschreibt die Beziehung zwischen dem Bildausschnitt des Films und 
dem angenommenen Blickpunkt der Figur. Unter primärer interner Okula- 
risierung verstehen sie den suggerierten Blick einer Figur, das Bild wird so 
präsentiert, als ob eine Person es sehen würde. Beispiele dafür sind sämt- 
liche irgendwie verzerrten, unscharfen Bilder aus der Perspektive eines 
Betäubten oder Betrunkenen. Demgegenüber wird die sekundäre interne 
Okularisierung durch den Kontext einer Figur zugeordnet, sie bezeichnet 
den klassischen Point of View Shot. Die Null-Okularisierung deckt sämtli- 
che anderen Blickpunkte ab. Und um den beiden Kanälen Auge und Ohr 
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gerecht zu werden, über welche sich die kinematografische Kommunika- 
tion abwickelt, wurde der Begriff Aurikularisierung (auricularisation) ein- 
geführt, der die auditive Subjektivierung definiert. Unter interner Auri- 
kularisierung versteht man demnach einen subjektivierten Ton. Er wird 
als sekundäre interne Aurikularisierung entweder auf der visuellen Ebene 
erklärt (jemand befindet sich unter Wasser oder hält sich die Ohren zu) 
oder als primäre interne Aurikularisierung so deutlich gefiltert, dass sich der 
Effekt von selbst erklärt. 

Persönlich begrüße ich eine dreidimensionale Unterscheidung sehr, 
vor allem die Berücksichtigung des Tons im Komplex der Blickpunkt- 
Theorie. Dennoch meine ich, dass dieses Konzept zwar genau, aber 
umständlich ist. Metz (1991: 115) schlägt deshalb die Begriffe mentale, visu- 
elle und auditive Fokalisierung vor. Die Problematik dieses terminologischen 
Vorschlags liegt darin, dass sich der Begriff Fokalisierung nicht mit dem 
Begriff Subjektivierung deckt. Fokalisierung ist vielmehr ein übergeordne- 
tes Konzept, in welchem die Subjektivierung als Teilbereich erscheint. 

Die Begrifflichkeit, mit der die verschiedenen Subjektivierungsstrate- 
gien gefasst werden, sollte sprachlich transparent sein. Ich führe deshalb 
folgende Unterscheidungen ein: mentale, visuelle und auditive Subjektivie- 
rung. Dieses Spektrum wird erweitert um die Unterscheidung zwischen 
markierten und simulierten Subjektivierungen. Markierte Subjektivierungen 
äußern sich auf der Tonspur beispielsweise in extradiegetischen Klangob- 
jekten, die als Kommentar fungieren. Simulierte auditive Subjektivierun- 
gen werden durch mehr oder weniger deutliche Verzerrungen oder Ver- 
fremdungen der Klangobjekte kommuniziert. 


Die Ambivalenz der Zuschreibung zum 
wahrnehmenden Subjekt 


Brauchen simulierte Subjektivierungen eine kontextuelle Stütze, auf deren 
Basis man sie deuten kann, oder ist die Transformation ohne Weiteres 
verständlich? Die Frage lässt sich auch anders stellen: Gibt es eine objek- 
tiv erscheinende Darstellungsform — in Form einer mentalen Repräsen- 
tation im Kopf des Zuschauers oder einer verfestigten Codierung -, die 
als neutrale Referenz den Abgleich der subjektivierenden Verfremdung 
ermöglicht? Oder orientieren sich die Simulationen so deutlich an der 
Alltagswahrnehmung, dass man sie anhand eigener Erfahrungen lesen 
kann? 

Immerhin bezweifelt Metz (1991: 118), dass sich die simulierten 
Subjektivierungen aus der Art der Deformation ohne Hilfe des Kon- 
texts unmittelbar selbst erklären. Im Gegensatz zu Jost ist er der Mei- 
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nung, dass jede Form der Subjektivierung der Mitarbeit eines Kontexts 
bediirfe. Traditionell wird die kontextuelle Anbindung einer subjektivier- 
ten Einstellung von der Montage geleistet. Man sieht kurz davor oder 
danach die Figur, deren Perspektive der Film einnimmt. Weiter nennt 
Metz (1991: 117) auch die Möglichkeit einer eindeutigen Zuordnung über 
den Dialog. Das Problem bestehe in der Zuschreibung zum wahrneh- 
menden Subjekt: Wer sieht das verzerrte Bild oder hört die verfremdeten 
Klänge? 

Tatsächlich zeigt sich in der Analyse der diversen Subjektivierungs- 
formen insbesondere der zeitgenössischen Tonspuren, dass ein solcher 
Kontext gegeben sein muss. Nur wird er wesentlich weiter gefasst als im 
klassischen Hollywood-Kino. Wie Brinckmann (1981: 105) schreibt, wer- 
den unbestimmte Schwebezustände im Rahmen von Subjektivierungen 
bereits im Film noir der 1940er bewusst in Kauf genommen. 


[...] es geht weniger darum, die Verzerrungen persönlicher Wahrnehmung 
zu beschreiben, als darum, die vom Subjekt erfahrene Welt als eine verzerrte, 
albtraumhafte darzustellen. Eine deutliche Etikettierung dieser Sicht als pa- 
thologisch würde diesem Eindruck entgegenwirken, die Zuschauer beruhi- 
gen oder distanzieren, statt sie einzubeziehen. (Brinckmann 1981: 105) 


Anhaltende Ambivalenz — damit habe ich mich schon im Zusammenhang 
mit dem unidentifizierbaren Klangobjekt (> 126) befasst — wird als Mittel 
zur Spannungssteigerung und zum vermehrten emotionalen Einbezug 
des Zuschauers vom zeitgenössischen Film instrumentalisiert. Unscharfe 
Konzepte beflügeln die Fantasie, indem sie Projektionsflächen für indivi- 
duelle Interpretationsstrategien bilden. Das gilt besonders für die reichhal- 
tige, vielschichtige Tonspur, in der jedes einzelne Klangobjekt aus seinem 
ursprünglichen Umfeld herausgelöst, bis zur Unkenntlichkeit bearbeitet 
und in einen neuen Kontext gestellt wird, wobei die Sound Designer exakt 
darauf achten, die strukturbildenden Überlegungen zu verwischen und 
alles wie zufällig erscheinen zu lassen. Damit wahren sie nicht nur den 
Eindruck von lebensweltlicher Authentizität, sondern lassen das Werk frei 
von einer deutlich wahrnehmbaren Intention im Raum der Imagination 
schweben. Diese kreative Taktik kommt besonders bei den zahlreichen 
Subjektivierungsstrategien zur Anwendung, die mit mehrheitlich schwer 
zu identifizierenden Klangobjekten operieren oder Klangobjekte ihrer 
ursprünglichen Bedeutung berauben, indem sie diese in ungewohnte, teils 
sogar unplausible Zusammenhänge integrieren, wie sich konkret noch in 
der Fallstudie zu ArocALYPsE Now (> 383) und im Abschnitt zu den ver- 
schiedenen Strategien (> 395) zeigen wird. 
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Fur die auditiven Subjektivierungen kommen als Referenz sowohl 
die visuelle Repräsentation als auch weitere Teile der Tonspur infrage. Der 
primär asymmetrische, mehrfach codierte Modus der kinematografischen 
Kommunikation öffnet ein weitverzweigtes Arsenal von potenziellen 
Referenzebenen. Ist der Kontext ein weiteres textliches, akustisches oder 
optisches Umfeld, ein simultan dargebotenes Bild oder ein Teilaspekt der 
mehrschichtigen Tonspur? Wann immer antinaturalistische Klangobjekte 
zu hören sind, wird der Wunsch entstehen, die potenzielle Mehrdeutig- 
keit dieser Transformation abzubauen und die Erscheinung irgendwie zu 
erklären. 

Die fortdauernde, intendierte Ambivalenz macht die theoretische 
Behandlung der vielfältigen Erscheinungsformen von Subjektivierungen 
besonders schwierig. Viele optische und akustische Transformationen 
des zeitgenössischen Mainstreamfilms sind nur unterschwellig wirksam 
und treten erst unter dem Vergrößerungsglas des aufmerksamen Analyti- 
kers überhaupt zutage. Dazu gehören die Veränderungen der akustischen 
Zeichnung von Orten und Materialien, die im weiteren Sinne zum Kon- 
text Subjektivierung gehören und doch unter einem neuen theoretischen 
Gesichtspunkt betrachtet werden müssen. Es sind Phänomene, die das 
Gefühl einer Subjektivierung vermitteln, ohne durch den Kontext in ein- 
deutiger Weise einem Fokus zugeschrieben zu werden. Metz blendet diese 
Phänomene aus der eigentlichen Subjektivierungsdebatte aus. Vielmehr 
diskutiert er sie unter dem Gesichtspunkt der Unterscheidung zwischen 
Enunziationsmarkierungen (marques d’énonciation) und Stil (Metz 1991: 
151 ff.). Es lohnt sich, diese Begriffe genauer zu erörtern, weil sie speziell 
in Bezug auf die mehrdeutigen Transformationen von Klangobjekten 
Wesentliches zur analytischen Klärung beitragen. 


Enunziationsmarkierungen 


Unter Enunziationsmarkierungen fasst Metz alle Phänomene zusammen, 
in denen «der Film» direkt zum Zuschauer spricht. Als Beispiele führt er 
die klassischen Formen der filmischen Interpunktion an, wie zum Beispiel 
Schwarzblenden, welche signalisieren, dass eine neue Szene anfängt. Wei- 
ter bezieht er auch nicht neutrale Bilder und Geräusche mit ein, in denen 
sich deutlich ein Eingriff - ich würde sagen: eine Transformation — mani- 
festiert. Dieser Eingriff kommt nicht von einer Figur, sondern — wie Metz 
es ausdrückt - von oben (d’enhaut), von einer unsichtbaren, schwer zu defi- 
nierenden Erzählinstanz, die Metz auch schon Zeremonienmeister genannt 
hat. Solche direkten Interventionen der Erzählinstanz bezeichnet er als 
objektiv-gerichtet (1991: 152), das heißt, es wird gewissermaßen eine Vek- 
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torisierung weg von einer als nattirlich empfundenen Wiedergabe hin zu 
einer deutlichen Färbung praktiziert, die jedoch im Gegensatz zur Subjek- 
tivierung keiner Figur zuzuschreiben ist. 

Metz illustriert den Unterschied zwischen einem neutralen und 
einem objektiv-gerichteten Klangobjekt mit einem Tonbeispiel. Es ist 
eine der wenigen Textstellen bei Metz (1991), die sich konkret mit der 
Anwendung seiner Theorie auf die außersprachlichen Phänomene der 
Tonspur beschäftigen; ich zitiere sie in voller Länge, weil das Beispiel 
einige wesentliche Rückschlüsse auf die Anwendung seines Konzepts auf 
die Tonspur erlaubt: 


Mit den so genannt wirklichen Geräuschen wird es natürlich viel schwieriger, 
einen Adressierungskoeffizienten auszumachen. Es besteht die Gefahr, dass 
man ihn irgendeinem Ton außerhalb des Bildes zuschreibt, weil sich dieser 
immer an das Publikum richtet, oder dass man ihn den Tönen grundsätzlich 
abspricht, weil sie sich wegen ihrer nichtsprachlichen Natur überhaupt nicht 
direkt an das Publikum wenden können. Man kann nur sagen, dass es auf- 
dringliche oder seltsame Off-Geräusche gibt, die entweder betont oder ver- 
dichtet, oder sogar störend und traumatisch, sind und sich durch eine etwas 
verschwommene Evidenz von den anderen unterscheiden. Und man unter- 
scheidet ohne weiteres zwischen dem Telefonklingeln im benachbarten Zim- 
mer oder dem Vorbeidonnern eines großen Lastwagens auf der rückliegenden 
Landstraße und den verwirrenden Geräuschen, die von schweren Stiefeln 
während Verfolgungsjagden verursacht werden, verhallt und von ihrem 
eigenen Echo zerhackt, und die den Zuschauer mit ihrem ebenso einfachen 
wie prachtvollen Spiel fesseln, während Harry Lime in THE THIRD MAN (ich 
komme auf diesen sehr «auditiven Film» zurück) durch die Abwasserkanäle 
Wiens gejagt wird. [...] Es ist offensichtlich [...] der Film, der versucht, uns 
etwas zu sagen, selbst wenn die verstärkte Klanglichkeit von THE THIRD MAN 
von den Verfolgern in der Akustik jenes Ortes tatsächlich so wahrgenommen 
worden wäre. Bei Carol Reed ist das Geräusch zwar diegetisch, aber es wird 
hervorgehoben. [... Dieses Beispiel zeigt uns,] wie brüchig, aber auch wie 
reichhaltig die Grenze ist zwischen den subjektiven Geräuschen und jenen, 
die direkt einen Eingriff der Enunziationsquelle darstellen.’ (Metz 1991: 149.) 


7 «Avec les bruits dits «réels», il est évidemment plus difficile d’invoquer quelque coef- 
ficient d’adresse. On court le risque de l’attribuer à n'importe quel son <extérieur a 
l'image, puisqu'il est toujours, par cela même, détourné vers l'audience, ou alors de 
le refuseratous, car leur nature non-linguistique leur interdit de viser le spectateur de 
facon explicite. On peut dire seulement qu'ils existent des bruits off ou hors-champ 
insistants ou étranges, scandées ou distillés, ou alors interruptifs et traumatiques, qui 
se distinguent des autres avec une évidence un peu opaque. Et tout le monde fait la 
différence entre la sonnerie d’un téléphone dans la piéce voisine, ou le vrombissement 
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Metz bezieht sich damit auf den immanent suggestiven Charakter des 
Geräuschs, das — wie immer es gestaltet ist - vom Zuschauer allzu bereit- 
willig der Diegese zugeordnet wird. Er spricht denn auch von der etwas 
undurchsichtigen Art und Weise, wie sich die klanglich transformierten 
von anderen als neutral empfundenen Klangobjekten unterscheiden. Den- 
noch ist diese Transformation fühlbar, sie lässt sich empirisch belegen, 
denn alle empfinden sie. Die klangliche Aufbereitung des Geräuschs in 
THE THIRD MAN (USA 1949, Carol Reed) - zu beschreiben als Vergröße- 
rung und leicht übertriebene Halligkeit — kann entweder als Hinweis auf 
die emotionale Situation der Figur verstanden werden (und wäre dann als 
Enunziationsmarkierung eine Färbung, die der Erzählinstanz zugeschrie- 
ben werden müsste) oder als direkte Simulation der Wahrnehmung Harry 
Limes interpretiert werden. Denn die Schritte haben in diesem Moment 
für die Figur eine verschobene, überhöhte Bedeutung, die sich in der 
Klanglichkeit niederschlägt. 

Hier und auch andernorts wird deutlich, dass der Spielraum der 
Interpretation nicht völlig abgebaut werden kann. Es bleibt immer eine 
Frage des persönlichen Standpunkts, ob die eine oder andere Variante 
zum Tragen kommt. Dennoch ist die von Metz vorgeschlagene Differen- 
zierung nützlich, weil sie das Bewusstsein für die verschiedenen gestalte- 
rischen Spielarten schärft. Die komplexe Materie lässt sich allerdings ver- 
einfachen, wenn man auf das Urkonzept von Genette zurückgreift. 


Dieser Typus der Enunziation, der gleichzeitig objektiv und markiert ist, [...] 
entspricht im wesentlichen dem externen (= außerhalb der Figur) Modus 
des Erzählens, wie er in der literarischen Tradition und von Gerard Genette 
definiert wurde [...]. Er bildet tatsächlich einen Gegensatz sowohl zum Blick- 
punkt einer Figur (= interner oder subjektiver Modus) als auch zum Fehlen 
eines Blickpunkts (der «allwissenden», «ausgelöschten» oder «transparen- 
ten» Enunziation usw.) (Metz 1991: 154) 


d’un gros camion sur la route derriére, et les rumeurs confuses de poursuites bottées, 
réverbérées, hachées par leur propre retour d’écho, qui sollicitent de leur theätre facile 
et somptueux, a la fin de la bande, le spectateur-auditeur du TROISIEME HOMME (je 
retombe sur ce film qui est très <auditif>), cependant qu’Harry Lime est traqué dans les 
égouts de Vienne. [...] C'est évidemment [...] le film qui cherche a dire quelque chose, 
même si [...] les sonorités amplifiées du TROISIEME HOMME ont été vraiment perçues 
par les poursuivants pris dans l’acoustique des lieux. Chez Carol Reed, le bruit est dié- 
getique mais exhibé. [... Cet exemple montre] combien fragile et riche est la frontière 
entre les bruits «subjectifs> et ceux qui manifestent une intervention directe du foyer 
d’énonciation. 

8 «Ce type d’énonciation, a la fois objectif et marqué [...] correspond pour l'essentiel au 
régime narratif «externe» (= extérieur au personnage) tel qu’il est défini par la tradi- 
tion littéraire et par Gérard Genette [...]. Il s’oppose, en effet, au point de vue du per- 
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In der Enunziationsmarkierung tritt eine Kommunikation, die latent 
immer vorhanden ist, an die Oberfläche, der Diskurs wird zum Sub- 
jekt der Aussage. Dieses Phänomen lässt sich auch auf der Basis einer 
Unterscheidung zwischen Zeigen und Sagen erklären, einer Unterschei- 
dung, die schon von Plato mit den Begriffen mimesis (zeigen) und diegesis 
(sagen) vorgenommen wurde, mit welchem die explizite oder implizite 
Präsenz der Erzählinstanz in der Erzählung bestimmt werden kann. Im 
Gegensatz zu Plato beschreibt Aristoteles beide Formen als Variantender 
Mimesis, eine Auffassung, der ich persönlich — vor allem in Bezug auf 
die filmische Erzählung - besser folgen kann. Also: Der Film zeigt uns 
etwas - in Form optischer, sprachlicher oder akustischer Codes -, und 
er sagt uns etwas in Form eines sogenannten Metadiskurses, eines über- 
lagerten, mehr oder weniger offensichtlichen Kommentars. Die verschie- 
denen Codes begleiten und überlagern einander, widersprechen sich 
oder produzieren Redundanz. Damit wird der Zuschauer, wie Barthes 
(1970: 146) schreibt, «nicht Komplize dieser oder jener Person, sondern 
des Diskurses selbst, [...] der Diskurs und nicht diese oder jene Person ist 
der einzige positive Held der Geschichte.» 


stil 


Nun zieht Metz jedoch eine Größe in Betracht, die zunächst den Gegen- 
stand wieder zu «verkomplizieren» scheint: den Stil. Der Begriff Stil 
wird in der theoretischen Debatte sehr kontrovers und bisher nicht völlig 
überzeugend diskutiert. Es kann an dieser Stelle kein weit ausgreifender 
Exkurs in dieses Thema stattfinden, sondern lediglich das Konzept von 
Metz berücksichtigt werden, in erster Linie zum Zweck einer schärferen 
Einkreisung der Komplexe Subjektivierung und Enunziation, sozusagen ex 
negativo. 

Im Stil wird ebenso wie in der Enunziationsmarkierung oder in der 
Subjektivierung eine Abweichung von einer neutralen, das heißt, auch 
naturalistischen, Darstellung deutlich. Ausgehend von Aumonts (1988: 61) 
Überlegungen zur avantgardistischen Technik der «entfesselten Kamera», 
stellt Metz fest, dass die spektakuläre Freiheit des sich ständig wandeln- 
den Blickpunkts keines wahren oder falschen Alibis einer schauenden 
Figur bedarf. Diese Beobachtung wirft die Frage auf, ob der Stil und im 
weiteren Sinn auch das Genre als Stilkollektiv nicht ebenfalls zu den Enun- 
ziationsmarkierungen zu zählen sei. Der Stil sei, so Metz (1991: 155), wie 


sonnage (= régime dit interne, ou subjectif), aussi bien qu’à l'absence de point de vue 
(énonciation <omnisciente>,<effacée», «transparente, etc.).» 
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ein Markenzeichen Trägereines Namens: Man erkennt einen klassischen 
Western, wie man einen Hibiskus oder einen Foxterrier erkennt. Der cine- 
phile Kenner unterscheidet weiter anhand formaler Kriterien einen «Wel- 
les» von einem «Ozu» oder «Bresson». 


Der Stil, so sagt man, verweise auf den «Autor». Ja, aber immer und per De- 
finition auf einen bestimmten Autor (oder eine bestimmte Schule usw.), wäh- 
rend die Enunziationsquelle eine unpersönliche, anonyme Instanz ist, die ge- 
wissermaßen für jeden Film die gleiche ist, weil sie nie etwas anderes sagt als: 
«Dies ist ein Film.» Die Enunziationsmarkierungen bezeichnen niemanden. 
Sie bezeichnen, wie ihr Name sagt, die Aktivität, die das Enunziat hervor- 
bringt, den filmischen Akt als solchen, der im Grunde immer gleich bleibt.’ 
(Metz 1991: 155) 


Von allen Charakteristika, die Metz (1991: 158f.) für die Unterschiede 
zwischen Enunziationsmarkierungen und Stil anführt, scheinen mir die 
folgenden beiden von Bedeutung für den Gegenstand dieser Arbeit: Die 
Enunziationsmarkierungen sind Bausteine der logischen Konstruktion 
der filmischen Erzählung; wenn man sie entfernt, ändert sich die Erzäh- 
lung maßgeblich. Außerdem befinden sie sich auf der Ebene des Meta- 
diskurses im Gegensatz zu den Stilmerkmalen, die mit dem Diskurs ver- 
schmelzen. «Francis Vanoye hat [im Verlauf eines Seminars] folgende 
Unterscheidung vorgeschlagen: Die Enunziation ist eine Operation, der 
Stileine Art zu sein» (Metz 1991: 159).!° Ein akustisches Stilmerkmal ist 
beispielsweise die unterschiedliche klangliche Aufbereitung von Raum- 
schiffen in der STAR Wars-Trilogie im Unterschied zu den STAR TREK- 
Filmen. 

Die Grenzen zwischen beiden können sich verschieben. Stilistische 
Eigenheiten einer bestimmten Epoche können zu Enunziationsmarkie- 
rungen mutieren, wenn sich ihre Bedeutung über den wiederkehrenden 
Gebrauch verfestigt hat. Metz zitiert als Beispiel die Voiceover-Narration, 
die im Film noir der 1940er-Jahre zunächst als Stilmerkmal des neuen ame- 
rikanischen Kinos galt, um im Laufe der Zeit zum unabhängigen und ano- 


9 «Le style, nous dit-on <renvoie a l’«auteur». Oui, mais toujours et par défini- 
tion, a tel auteur (ou telle Ecole, etc.), alors que le foyer d’énonciation est une ins- 
tance impersonnelle, anonyme, en quelque façon «la même» pour tous les films, 
puisqu’elle ne dit jamais rien d'autre que «Ceci est un film». Les marques d’énoncia- 
tion ne désignent personne. Elles désignent, comme leur nom indique, l'activité qui 
produit l'énoncé, l'acte filmique comme tel, toujours identique à lui-même en son 
fond.» 

10 «Francis Vanoye [au cours d’une discussion de séminaire] a proposé de résumer tout 
cela comme suit: l'énonciation est une operation, le style une manière d’être.» 
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nymen Instrument der Erzählung zu werden. Ähnliches lässt sich zum 
Beispiel — wie wir sehen werden - auch im Gebrauch der Zeitlupe beob- 
achten. Sobald innerhalb eines STAR Wars-Films eine feindliche Galaxie 
durch das klangliche Repertoire des STAR TREK-Universums gezeichnet 
wird, mutiert ein stilistisches Merkmal zu einem semantischen Operan- 
den, allerdings nur für die eingeweihten Habitues. 

Alle diese theoretischen Überlegungen müssen nun an Fallbeispielen 
konkretisiert werden. Das analytische Instrumentarium, das im Laufe des 
theoretischen Überblicks zusammengetragen wurde, lässt sich in folgende 
Fragen übersetzen: 

Wer nimmt wahr, das heißt in der Terminologie Genettes: Wer ist der 
Fokus der Subjektivierung? Ist die Transformation überhaupt Ausdruck 
einer subjektiven Wahrnehmung, ist sie eher eine Enunziationsmarkie- 
rung oder eine stilistische Eigenheit? Inwiefern wird der Informationsfluss 
im Sinne Genettes verändert? Welche Information wird durch die Ver- 
änderung transportiert? Wie wird die Wahrnehmung formal umgesetzt? 
Wird sie simuliert oder markiert? Wie wirkt sie sich auf Bild, Ton oder 
narrativen Kontext aus? Decken sich die visuelle, narrative und akustische 
Positionierung? 


Fallstudie BLACKMAIL 


Die Situation in BLACKMAIL (GB 1929, Alfred Hitchcock, 0.46.40-0.47.46) 
ist relativ einfach und eignet sich deshalb gut für den Einstieg. Die Prota- 
gonistin Alice sitzt am Frühstückstisch, nachdem sie in der vergangenen 
Nacht in Notwehr einen aufdringlichen Maler mit dem Messer erstochen 
hat. Ihre Nachbarinnen unterhalten sich in einiger Entfernung über den 
Mord, ohne zu wissen, dass sie die Täterin ist (Abb. 52). 

Alice schaut mit leerem Blick vor sich hin. Das Gespräch transfor- 
miert sich zu einem akustischen Brei, der nur noch aus dem Wort «knife» 
zu bestehen scheint (Abb. 53). 

Die auditive Subjektivierung erscheint infolge des verfremdenden 
Eingriffs als Simulation aus der Perspektive der Protagonistin. Sie hat 
keine Entsprechung in einer visuellen Transformation. Vielmehr ist die 
Protagonistin von außen sichtbar, in Metz’ Worten objektiviert. Der leere 
Blick könnte dahingehend interpretiert werden, dass die Figur - in sich 
selbst versunken — ganz Ohr ist. Ihre obsessive Beschäftigung mit dem 
Messer wurde zuvor schon visualisiert, indem sie auf dem Heimweg über 
den Picadilly Circus auf einer Neon-Leuchtwand ein blinkendes Messer 
zu sehen glaubte. Der nähere und weitere Kontext markiert also Alice ein- 
deutig als Fokus der Subjektivierung. 


382 Subjektivierungen 


Trotzdem erscheint Hitchcocks Subjektivierungsstrategie zwar 
interessant, aber befremdlich.” Im Kontext zeitgenössischer Filme muss 
sie aufgefallensein, weil sich solche Verfahren sonst nirgends finden. 
Aus diesen Beobachtungen lässt sich schließen, dass die Subjektivie- 
rungsstrategien nicht nur eine Wahrnehmung simulieren, sondern 
auch über ein gewisses Maß an Verfestigung verfügen müssen, die dem 
Zuschauer das Lesen erleichtert. Potenziell besteht bei subjektivieren- 
den Eingriffen, die nicht konventionell codiert sind, die Gefahr, dass 
der Diskurs störend an die Oberfläche tritt und den Film als Artefakt 
entlarvt. 


11 Zu Hitchcocks frühen Subjektivierungen meint Weis (1985: 302): «Die Tonmanipu- 
lationen in Hitchcocks frühen Filmen [...] sind ziemlich offensichtlich experimen- 
tell. In BLACKMAIL und MURDER kann man beobachten, wie Hitchcock sowohl ver- 
sucht, die technischen Hindernisse des frühen Tonfilms zu überwinden, als auch 
eine persönliche Herangehensweise an die Ton-Bild-Beziehung zu entwickeln. Die 
meisten Experimente stehen in der expressionistischen Tradition, am bekanntesten 
sind die subjektive Verfremdung des Wortes «knife» in BLACKMAIL und der innere 
Monolog in MURDER. Beide Experimente sind Versuche, die Gedanken und Gefühle 
der Figuren auszudrücken. Gleichzeitig ziehen jedoch beide Techniken Aufmerk- 
samkeit auf sich, erscheinen als Tricks und sprechen das Publikum emotional nicht 
an.» 

(«The manipulations of sound in Hitchcock’s earliest sound films [...] are quite 
openly experimental. In BLACKMAIL and MURDER Hitchcock can be observed trying 
both to overcome the technical obstacles of early sound shooting and to establish his 
personal attitude toward the relation between sound and picture. Most of the experi- 
ments are in the expressionistic mode, the two most famous examples being the sub- 
jective distortion of the word <knife> in BLACKMAIL and the interior monologue in 
MURDER. Both experiments are attempts to convey a character’s thoughts and feel- 
ings. Yet at the same time both techniques draw attention to themselves as tricks and 
leave the audience emotionally outside the characters.») 

Leider stellt Weis nicht dar, worauf sich ihre These stiitzt, dass die Offensichtlichkeit 
der Manipulation als solche die Illusion stört. 
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Fallstudie APOCALYPSE NOW 


Die Anfangsszene aus APOCALYPSE Now (USA 1979, Francis Ford Cop- 
pola, 0.00.00-0.07.12) gehört zum Kompliziertesten, was sich hinsichtlich 
der Subjektivierungsdiskussion überhaupt finden lässt. Entscheidend fiir 
die genaue Analyse ist die Untersuchung der Transformationen auf der 
Bild- und Tonebene und besonders der zeitliche Abgleich der verschiede- 
nen Elemente, die ich aus diesem Grund in einer Tabelle aufgelistet habe. 
Die intensive Beschäftigung mit dieser Szene lohnt sich deshalb, weil sie 
auf engem Raum sehr unterschiedliche formale Verfahrender Subjektivie- 
rung vereinigt. 

Wer nimmt wahr, das heißt in der Terminologie Genettes: Wer ist der Fokus 
der Subjektivierung? 

Als Fokus der Subjektivierung schält sich nach und nach Willard 
heraus, dessen Name in dieser Szene allerdings noch nicht genannt wird. 
Ein erster Hinweis auf die Anbindung der Bilder und Geräusche an eine 
Figur erfolgt in 3): Die Mehrfachbelichtung stellt einen Zusammenhang 
zwischen dem Gesicht, dem brennenden Dschungel und dem Decken- 
ventilator her. Das Schlagen des Hubschraubers und die visuelle Analo- 
gie der rotierenden Blätter binden den Deckenventilator perzeptiv an den 
Hubschrauber an. Diese Analogie wird in 6) weiter ausgebaut und stärkt 
außerdem die Verbindung zu Willard als Fokus, da es sich bei der visu- 
ellen Repräsentation um einen Point of View-Shot (PoV) handelt. Anders 
ausgedrückt: Willard — auf dem Bett liegend - sieht den Deckenventilator 
ungefähr so, wie ihn der Zuschauer sieht. Wirklich eindeutig wird die Ver- 
knüpfung in der nächsten Einstellung (7), die als anthropomorphe Kame- 
rabewegung einen Blick simuliert, der über die Finger schweift, welche 
die Jalousielamellen auseinanderklappen, im anschließenden Umschnitt 
8) auf das Gesicht Willards in seiner Mehrdeutigkeit verengt wird und 
retrospektiv klar als dessen Blick identifiziert werden kann. Die Einstel- 
lung 8) entlarvt die Erzählerstimme aus 7) als metadiegetische Voiceover- 
Narration: Wir sehen das Gesicht und hören die Stimme, ohne dass sich 
die Lippen bewegen. 

Ist die Transformation überhaupt Ausdruck einer subjektiven Wahrneh- 
mung, ist sie eher eine Enunziationsmarkierung oder eine stilistische Eigenheit? 

Bevor der Fokus feststeht, kann diese Frage nicht eindeutig beant- 
wortet werden, das gilt in besonderem Maß für den verfremdeten Hub- 
schrauber, der mit verlangsamtem, geisterhaftem Schlagen der Rotor- 
blätter den Zuschauer in einem Winkel von 360° umfliegt, den Zuschauer 
also in die Mitte des Klangobjekts platziert. Der Text des Doors-Songs 
fungiert mehrmals als extradiegetischer Kommentar. In 2) erklingt «This 
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is the end» simultan zu den aufschlagenden Flammen, später in 5) «all the 
children are insane» simultan zum Bild von Whiskyflasche und Glas. Der 
Text des Songs befindet sich als Kommentar auf der Ebene des Metadis- 
kurses. Nachdem Willard als Fokus etabliert wurde, ist es plausibel, dass 
die Transformationen seiner Wahrnehmung zugeschrieben werden. Der 
zunehmende Hall, welcher dem Song ab der Textstelle «all the children 
are insane» zugemischt wird, kann ebenfalls als Enunziationsmarkierung 
interpretiert werden und generiert gleichzeitig einen Lerneffekt, indem er 
über die Assoziation von Text («insane») und Bild (Whiskyglas und Fla- 
sche) mit dem semantischen Feld Rausch-Halluzination-Irrsinn verbun- 
den wird. 

Wie wird die Wahrnehmung formal umgesetzt? Wie wirkt sie sich auf Bild, 
Ton oder den narrativen Kontext aus? Decken sich die visuelle, narrative und 
akustische Positionierung? 

Es lässt sich eine Vielzahl von formalen Strategien ausmachen. Als glo- 
bale Strategie ist die Dissoziation von Ton und Bild zu nennen. Unter Dis- 
soziation ist eine deutliche, wahrnehmbare Trennung zwischen der akusti- 
schen und optischen Darstellung zu verstehen, die im folgenden Abschnitt 
(> 395) genauer untersucht wird. Visuelle und akustische Repräsentation 
decken sich nur punktuell. Als erstes diegetisches Geräusch, das mit dem 
Bild korreliert, ist das leise Klappern der Jalousie zu hören (8). Die akus- 
tische Zeichnung der Stadt wirkt zwar stilisiert und sehr reduziert, aber 
plausibel; die summende Fliege (10) charakterisiert das tropische Hotel- 
zimmer. Als nächstes diegetisches Geräusch ist das knisternde Brennen 
der Zigarette oder des Joints zu hören (11), später das Zerbrechen des 
Spiegels (13). Der halluzinatorische Realitätsverlust äußert sich weitge- 
hend im Fehlen von adäquaten Geräuschen, die sich mit der optisch reprä- 
sentierten Welt der Diegese decken. Bereits zu Beginn ist die Teilkompo- 
nente Schlagen der Rotorblätter des Klangobjekts Hubschrauber nicht nur 
signifikant zerdehnt, sondern sie steht auch isoliert da, ohne den Kontext 
eines konkreten Ortes. Weder der Dschungel, obwohl bildfüllend sichtbar, 
noch die Flammen des Napalm-Angriffs werden akustisch repräsentiert. 
In dem kurzen Moment (8-10), in dem die Geräusche einen realistischen 
Touch bekommen, übernimmt das Bild als PoV die subjektive Perspek- 
tive, es findet eine Verlagerung von auditiver zu visueller Subjektivierung 
statt. 

Diese kurze Spanne wirkt wie das Auftauchen aus einem Delirium. 
Die Veränderung des Realitätsbezugs wird durch die klangliche Transfor- 
mation des Hubschraubergeräuschs eingeleitet, das von Hubschrauber zer- 
dehnt schlagend zu Hubschrauber real mit allen drei Komponenten -Schlagen 
der Rotorblätter, hochfrequentes Heulen der Turbinen und Motorenge- 
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räusch von brummend bis rauschend - mutiert. Ähnlich verhält es sich mit 
der Transformation der Atmosphäre Stadt in die Atmosphäre Dschungel, 
welche mit dem Wort «jungle» der Voiceover-Narration verknüpft wird. So 
gewaltsam die Veränderung einer realistischen Lautsphäre zu einer ima- 
ginären Lautsphäre bei näherer Betrachtung wirkt, entgeht sie doch den 
meisten Rezipienten — wie verschiedene Visionierungen mit Studenten 
gezeigt haben. Klanglich knüpfen die Vögel an die Trillerpfeife an. Die 
Transformation geschieht nicht abrupt, sondern schleichend und entfernt 
sich immer mehr von der realistischen Zeichnung eines Ortes. Teil der for- 
malen Veränderung sind weiter die unidentifizierbaren Klangobjekte wie 
Sirren laut, das mit Grillen verfremdet interagiert, außerdem Rufe zerdehnt 
und Rumpeln undefinierbar donnerähnlich, mit welchen die Tonspur ein 
Gefühl des zunehmenden Abtauchens in einen halluzinatorischen Wahn 
erzeugt. 

Diese narrative Bewegung weg von einem realen Ort hin zu einer 
völligen Auflösung der Orientierung im Rausch wird im Folgenden aus- 
gebaut durch die beschleunigte perkussive Musik in Kombination mit 
dem rauschhaften Tanz in Zeitlupe, in welchem als einziges diegetisches 
Element das klirrende Zerbrechen des Spiegels einen kurzen Moment 
von authentisch wirkendem Realitätsbezug schafft. Zwar befindet sich 
der optische Blickpunkt außerhalb der Figur, die Zeitlupe korrespondiert 
jedoch mit einer subjektiven Zeitempfindung im Sinne einer mentalen 
Subjektivierung, die fehlenden Geräusche, welche durch die dominante 
Musik ersetzt werden, lassen sich als auditive Subjektivierung interpre- 
tieren. Akustisches Symbol des völligen Realitätsverlusts ist der stumme 
Schrei Willards. 

Als klangliches Element der auditiven Subjektivierung erscheint 
weiter die Stimme Willards, die man mit Chion (1985: 32f.) als voix-Je, als 
Ich-Stimme, bezeichnen kann. Der sprachlich-semantische Aspekt der 
Voiceover-Theorie wird in dieser Arbeit bewusst ausgeklammert, weil er 
ein eigenes ausgedehntes Terrain beansprucht. Aus meiner Sicht ist ledig- 
lich die klangliche Aufbereitung erwähnenswert. Die Stimme ist näm- 
lich so gestaltet, dass sie den Zuschauer über eine Im-Kopf-Lokalisation 
akustisch in die Position des Erzählers zwingt, indem sie extrem nah auf- 
genommen und über drei Lautsprecher wiedergegeben wird (Murch in 
LoBrutto 1994: 93). Will man den schwierigen Begriff Hörpunkt benutzen — 
was hier Sinn macht -, so deckt sich durch diese Technik der subjektive 
Hörpunkt der Figur mit dem Hörpunkt des Rezipienten. 

Wird die subjektive Wahrnehmung simuliert oder markiert? 

Beide Strategien sind in dieser Szene zu beobachten. Als Markierung 
können der zunehmende Hall auf dem Song (5) und die Zeitlupe (12) 
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interpretiert werden. Hall und Zeitlupe sind weitverbreitete - man könnte 
auch sagen: codierte — Techniken der Subjektivierung, die im Folgenden 
noch genauer analysiert werden. Nicht zu entscheiden ist die Frage in 
Bezug auf das Hubschraubergeräusch. Zu Beginn ist es lediglich verfrem- 
det und suggeriert das Gefühl einer Subjektivierung. Später, wenn es mit 
dem Deckenventilator assoziiert wird, könnte es durchaus als simuliert 
aufgefasst werden: Willard hört den Hubschrauber als auditive Fanta- 
sie, während er den Ventilator betrachtet. Die Dschungelgeräusche (11), 
die sich langsam aus der Stadtatmosphäre heraus entwickeln, können 
ebenfalls beides sein, wobei die Verknüpfung mit der Voiceover eher auf 
eine Simulation schließen lässt. Diese Sichtweise wird bestätigt durch die 
zunehmende Verfremdung und den Einbezug von UKOs, die sich in Ana- 
logie mit der fortschreitenden Abkoppelung des Subjekts aus der Realität 
entwickeln. Eindeutig simuliert sind die Point of View-Shots (6 und 7-9) 
sowie die Voiceover-Narration, die keine nachträgliche Interpretation des 
Geschehens liefert, sondern die Gedanken ohne logische Verknüpfung 
in der Art eines Stream of Consciousness repräsentiert, den Prince (1987: 
92) definiert als «eine Form der Darstellung des menschlichen Bewusst- 
seins, die den zufälligen Fluss der Gedanken darstellt und ihr unlogisches, 
ungrammatikalisches und assoziatives Wesen betont.»'? 

Inwiefern wird der Informationsfluss im Sinne Genettes verändert? Welche 
Information wird durch die Veränderung transportiert? 

Eine Vielzahl von Einfällen stehen in dieser Szene nebeneinander, 
aber keineswegs mit der Freiheit der Indifferenz, wie das Urteil von Metz 
nahe legt, sondern immer nachvollziehbar mit dem Gegenstand ver- 
knüpft über zwei Hauptstrategien, die als Assoziation auf der Ebene des 
Metadiskurses und als Dissoziation der optischen und akustischen Per- 
spektiven zusammengefasst werden können. Es stellt sich die Frage, ob 
sich die Subjektivierung vom Stil trennen lässt? Warum erscheinen selbst 
krasse Manipulationen natürlich, ohne — wie im Beispiel von BLACKMAIL — 
zu stören? In BLACKMAIL wirkt die Manipulation wie ein Pop-out-Effekt. 
Der experimentelle Charakter der Manipulation unterscheidet sich deut- 
lich vom traditionellen Erzählstil, in dem das Werk insgesamt gehalten 
wird; in APOCALYPSE Now hingegen überlagern sich verschiedene expe- 
rimentell wirkende, überzogene Techniken in sämtlichen Schichten der 
Narration. Wie häufig in Eröffnungsszenen wird der Zuschauer auf einen 
bestimmten Stil gestimmt, hier auf das surreale Moment einer grenzwer- 
tigen Kriegserfahrung, das bis zum bitteren Ende aufrechterhalten bleibt 


12 «A mode of representation of human consciousness focusing on the random flow of 
thought and stressing its illogical, «angrammatical», associative nature.» 
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und im Showdown, der andernorts (> 170) geschilderten Analogie zwi- 
schen der rituellen Schlachtung eines Ochsen und der Tötung von Kurtz, 
zu einem kaum zu überbietenden Höhepunkt gelangt. Der Verlust des 
Kontakts mit der Wirklichkeit, die psychische und physische Desorien- 
tierung ist eine Grundthematik dieses Werks. Die Sound Designer Walter 
Murch, der für das Gesamtkonzept zuständig war, und Richard Beggs, 
der die Hubschraubersounds herstellte und als Musikmischtonmeister 
(Music Re-Recording Engineer) die spektakuläre Interaktion von Geräu- 
schen und Musik verantwortete, bewegen sich mit ihren Einfällen virtuos 
am Limit dessen, was in der Kultur des Mainstreamfilms überhaupt mög- 
lich ist. 


Strategien 
Die Dissoziation von Ton und Bild 


Wenn Bild und Ton nicht zur Deckung zu bringen sind, wie in der Fallstu- 
die APOCALYPSE Now dargestellt, wird ein feststehendes Wahrnehmungs- 
system infrage gestellt. Die logisch-kausale Beziehung zwischen den opti- 
schen und akustischen Erscheinungen in der Welt ist fester Bestandteil 
der menschlichen Alltagswahrnehmung. Die intermodale Integration der 
verschiedenen Sinnesdaten aus dem auditiven und visuellen Wahrneh- 
mungssystem wurde im Kapitel Ton/Bild (> 137) ausführlich dargestellt. 
Wahrnehmungsverschiebungen können sich auch im wirklichen Leben 
durch Auseinanderklaffen von Sinnesempfindungen aus den verschiede- 
nen Modalitäten äußern. Rauschzustände, Halluzinationen, psychotische 
oder kognitive Störungen können zu Wahrnehmungstrübungen führen, 
die unter anderem ein Fehlverhalten auslösen, weil die Reize aus den 
verschiedenen Modalitäten nicht zueinander zu gehören scheinen. Auf 
diesen natürlichen Erfahrungshintergrund greift die filmische Narration 
zurück, wenn sie solche Empfindungen aus der Perspektive einer Figur 
darstellen soll. 

Unterscheiden sich die optische und akustische Repräsentation signi- 
fikant voneinander, entsteht ein logischer Konflikt, der durch kognitive 
Strategien abgebaut werden muss. Zwischen Bild und Ton entsteht eine 
Diskrepanz, die einen energetischen Fluss auslöst und den Zuschauer akti- 
viert. Die Dissoziation fordert eine Entscheidung. 

Grundsätzlich bestehen verschiedene Möglichkeiten: Entweder wirkt 
die akustische oder die optische Repräsentation realistischer und wird als 
Referenzebene gewählt, mit welcher die verzerrte Repräsentation abgegli- 
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chen wird, oder beide Codes liefern verzerrte Repräsentationen, die sich 
außerdem in der Art und Weise ihrer Verzerrung unterscheiden können. 
Häufig finden sich — wie in APocALyPsE Now - Transformationen in ver- 
schiedenen Schichten der Narration. Die Veränderungen - das möchte ich 
mit Nachdruck betonen — können nur dann adäquat interpretiert werden, 
wenn keines der Elemente - narrativer Kontext, Bild oder Ton - isoliert 
betrachtet wird. 

Eine Dissoziation von Ion und Bild lässt sich zum Beispiel über die 
Störung einer natürlich wirkenden Plausibilitätsbeziehung ausdrücken, 
die dann vorliegt, wenn die empirisch verankerte Wahrscheinlichkeit 
infrage gestellt wird, dass die gehörten und gesehenen Objekte in der dar- 
gestellten Situation zusammen vorkommen. Eine solche Manipulation 
kann zum Beispiel in THE PLAYER (USA 1992, Robert Altman, 0.33.12- 
0.37.34) beobachtet werden. Wenn Griffin Mill den mutmaßlichen Ver- 
fasser von erpresserischen Postkarten und Telefonaten, den frustrierten 
Drehbuchautor David Kahane, im Affekt umbringt, so sind nicht nur die 
Geräusche der Handlung verhallt, was angesichts der Parkhausakustik 
noch plausibel wäre, sondern auch die Glocken, die leitmotivisch an diesen 
Vorfall geknüpft sind und in den folgenden Tagen in Mills Kopf nachhal- 
len. Die Glocken werden zunächst im Kontext Parkhaus als unplausibles 
Klangobjekt aus der Diegese ausgefiltert.'? Später baut die Wiederho- 
lung dieses Klangobjekts die Assoziation zu Mills Gedankenwelt aus. Sie 
erklingen beispielsweise dann, wenn sein Blick auf die Schlagzeile einer 
Zeitung fällt, die den Mord an Kahane thematisiert. 

Unter dem Plausibilitätsaspekt kann auch die Transformation der 
Stadtatmosphäre zu einer Dschungelatmosphäre in der besprochenen 
Szene aus APOCALYPSE Now betrachtet werden. Obwohl der Schauplatz 
identisch bleibt, ändert sich seine akustische Zeichnung. Diese Verschie- 
bung führt auf der Seite des Rezipienten zu der Hypothese, dass es sich 
um eine subjektive Erscheinung handelt. 

Die Dissoziation von Bild und Ton ist eine übergeordnete Technik zur 
Darstellung von subjektiv motivierten Veränderungen. Sie ist sozusagen 
ein Sammelbecken für diverse etablierte Teilstrategien, die im Folgenden 
auf der Basis der analytischen Beschäftigung mit dem Korpus behandelt 
werden. 


13 Zu diesem Ergebnis bin ich durch eine nicht standardisierte Befragung von Studenten 
gekommen, welche die Glocken in überwiegender Mehrheit als Musik interpretierten. 
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Gerausche verschwinden 


Der Verlust des auditiven Kontakts zur Umwelt ist die häufigste Strate- 
gie zur Darstellung von auditiven Subjektivierungen. Auch sie gründet 
auf einem natürlichen Erfahrungshintergrund. Über das Gehör steht der 
Mensch in einem ständigen sensorischen Austausch mit der Welt, die ihn 
umgibt: Die Ohren lassen sich nicht verschließen. Selbst im Schlaf dringen 
einzelne Geräusche - abhängig vom emotionalen Wert, den sie für den 
Schlafenden besitzen - ins Bewusstsein. Wird nun dieses akustische Kon- 
tinuum im Film abgebrochen, entsteht eine Aussage. Das Verschwinden 
der Geräusche markiertoder simuliert einen Realitätsverlust. Das Subjekt, 
die Figur, erscheint von der Lautsphäre und damit von der Realität abge- 
koppelt. 

In Tue Ricut Sturr (USA 1983, Philip Kaufman, 0.37.45-0.41.47) ist 
das Verschwinden der Geräusche Ausdruck eines Bewusstseinsverlusts. 
Beim Versuch, mit seinem Düsenjet den Geschwindigkeitsrekord zu bre- 
chen, wird der Pilot Chuck Yeager ohnmächtig. Der Flug selbst wird aus 
den unterschiedlichsten Perspektiven sehr experimentell dargestellt. Point 
of View-Shots wechseln ab mit verschiedenen Außenaufnahmen des Jets 
sowie Großaufnahmen vom Gesicht des Piloten. Parallel dazu werden 
die wartenden Kollegen in der Kneipe dazwischen montiert. Bei einer 
Geschwindigkeit von mehr als Mach 2 transformieren sich erst die PoVs. 
Die Wolken verlieren ihre Konturen und verlaufen zu halluzinatorisch 
wirkenden grafischen Mustern. Die Klangwelt als Ganzes ist deutlich sur- 
real gefärbt, der Jet ist immer nur in kurzen Bruchstücken zu hören, auffäl- 
liger ist das Windgeräusch, das den Aspekt der Geschwindigkeit und der 
damit verbundenen Grenzerfahrung kommuniziert. Im Augenblick des 
Bewusstseinsverlusts und des drohenden Absturzes führt die Stille zur 
Antizipation des Todes. Diese Assoziation der verschwindenden Geräu- 
sche wurde außerdem bereits in der Eröffnungsszene (0.00.00-0.03.09) 
etabliert, als einer der Piloten bei einem Testflug abstürzt, dort aller- 
dings nicht im Sinne einer Subjektivierung, sondern als Enunziationsmar- 
kierung. 

Sehr viel später, am Ende des Films, stürzt Yeager selbst ab, die Anti- 
zipation scheint sich zu erfüllen. Die Szene (2.37.35-2.56.03) ist wiederum 
als Parallelmontage gestaltet, die sehr bemerkenswert ist. Denn der Fest- 
akt zu Ehren der ersten Astronauten, der parallel zu Yeagers Flug mon- 
tiert ist, findet rund 15 Jahre später statt. Diese Parallelführung zweier 
auseinanderliegender historischer Entwicklungen bildet das Grundthema 
des Films, sodass der Rezipient an dieser Stelle nichts Ungewöhnliches 
mehr in dieser Konstruktion erblickt. Die Geräusche verschwinden in dem 
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Moment, als Yeager sich mit dem Schleudersitz aus dem Jet katapultiert. 
Der vorangegangene Flug war noch zugespitzter experimentell aufberei- 
tet worden als das eben geschilderte Beispiel. Verschiedene PoVs, eine 
Mischung aus verfremdet sausenden Windgeräuschen mit dem keuchen- 
den Atmen Yeagers und aufgeregten Funkspriichen im Hintergrund jagen 
über die zunehmend beschleunigte Schnittfrequenz einem Höhepunkt 
entgegen: dem Absprung aus dem Jet. Die verschwindenden Geräusche 
können sowohl der subjektiven Wahrnehmung Yeagers zugeordnet wer- 
den als auch im Sinne einer Enunziationsmarkierung auf den bevorstehen- 
den Tod hinweisen. Im Moment des Aufpralls wird zum Festakt zurück- 
geschnitten, wo soeben eine mit weißen Federn geschmückte Tänzerin vor 
blauem Hintergrund in gleißendes Licht gehüllt - die optische Assoziation 
zu den Wolken im blauen Himmel ist deutlich - ein ätherisches Ballett auf- 
führt. Die irreal wirkende Klangtransformation wird auch hier weiterge- 
führt, auch hier löst sich die diegetische Klangsphäre mehr und mehr auf 
und bewegt sich auf die Stille zu. Danach sehen wir den schwarz rauchen- 
den Jet, eine Sirene wird langsam eingeblendet und dann taucht Yeager 
aus den Rauchwolken am Horizont auf; die Todesantizipation entpuppt 
sich als Täuschung. 


Verschwinden der Geräusche: 


e Our oF AFRICA (USA 1985, Sydney Pollack, 1.45.44-1.51.18): Finch Hat- 
ton holt Blixen mit dem Flugzeug ab und fliegt mit ihr nach Mombasa; 
während des Flugs dominiert erst die Musik, die Geräusche verschwin- 
den, dann ist nur noch der sausende Wind zu hören. 

e APOCALYPSE Now (USA 1979, Francis Ford Coppola, 1.59.18-2.21.05): 
Monolog Kurtz, Schlachtung Kurtz/Ochse. 

e ALIENS — THE RETURN (USA 1986, James Cameron, 0.04.53-0.08.05): Ri- 
pley im Krankenhaus erfährt, dass sie 57 Jahre im Weltraum geschlafen 
hat; Albtraum der Geburt eines unbekannten Wesens. 

e GwLory (USA 1989, Edward Zwick, 0.08.53-0.13.44): Feier im Heim von 
Shaw; es wird ihm angeboten, eine Truppe von Farbigen zu führen; sei- 
ne psychische Versehrtheit wird über die Subjektivierung dargestellt, 
die eine innere Distanz zum Milieu signalisiert. 

e TERMINATOR 2 (USA 1991, James Cameron, 1.02.01-1.17.42): Sarah, Ter- 
minator und Sohn fahren in die Wüste zu einem Waffenlager, wo sie 
sich eindecken; Sarah hat eine Vision vom Weltuntergang, die sich mit 
dem Prolog deckt. 

° Tue Prano (Neuseeland 1992, Jane Campion): Ada und Tochter kom- 
men in Neuseeland an (0.03.43-0.08.02): Geräusche verschwinden, 
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wenn das Klavier ertönt; (0.14.14-0.15.18): Blick auf das zurückgelasse- 
ne Piano am Strand und Flug über Baumwipfel. 

° APOLLO 13 (USA 1995, Ron Howard, 1.04.41-1.14.01): Umkreisung des 
Mondes, der Astronaut Jim Lovell sieht sich selbst auf dem Mond. 


Hall als Mittel der Subjektivierung 


Hall als Charakteristikum des Raums wurde im Kapitel Orientierung 
(> 300) dargestellt. Hier geht es um jene ziemlich häufigen Fälle, in wel- 
chen Hall einen Geisteszustand der Filmfiguren ausdrückt. Diese Verwen- 
dung kann nur teilweise auf eine natürliche Wahrnehmungsmodifikation 
zurückgeführt werden. 

Umso erstaunlicher erscheint es, dass Hall eine so dauerhaft veran- 
kerte Strategie zur Kennzeichnung von auditiven Subjektivierungen bil- 
det. Bereits in den 1940er-Jahren finden sich Beispiele, unter anderem in 
MURDER, My Sweet (USA 1944, Edward Dmytryk) und A DOUBLE LIFE 
(USA 1947, George Cukor) sowie in dem eher unbekannten, aber sehr 
innovativ mit der Tonspur arbeitenden TWELVE O’CLock HIGH (USA 1949, 
Henry King). In den Beispielen aus der Film noir-Serie ist es vornehmlich 
Hall auf Stimmen, die - bildlich gesprochen - im Kopf nachhallen und 
somit als akustische Rückblenden zu verstehen sind. In TWELVE O'CLOCK 
Hicu markiert er eine zeittypische Rückblendenstruktur. Die filmische 
Erzählung wird als persönliche Erinnerung aufgerollt, ohne strikt aus der 
Perspektive jener Figur geschildert zu werden, die sich erinnert. Am Ende 
schließt sich die Rahmenhandlung in der Gegenwart wieder. An den Uber- 
gangsstellen von Gegenwart zu Vergangenheit und zurück ist ein verhall- 
ter Männerchor zu hören. 

Zweifellos hat im Lauf der Zeit ein Verfestigungsprozess stattgefun- 
den, sodass man Hall als Enunziationsmarkierung interpretieren kann, als 
codierten Operanden, der eine auditive Subjektivierung bezeichnet, ohne 
sie zu simulieren. Als Referenzrahmen kommt die unveränderte räumli- 
che Situation infrage sowie andere nicht verhallte Klangobjekte im selben 
situativen Kontext. Entsprechend der eindeutigen Codierung sind bei die- 
ser Strategie Ambivalenzen selten, der kommunikative Aspekt steht im 
Vordergrund. 

Im Gegensatz zu anderen subjektiven Verzerrungen, die psychischen 
Zuständen von Filmfiguren zugeschrieben werden, nimmt der Hall eine 
Sonderstellung ein, weil er sich auch auf den Zuschauer direkt auswirkt. 
Wenn ich am Hallgerät experimentiere, habe ich nach einiger Zeit mit 
Schwindelgefühlen und Übelkeit zu kämpfen. Das Auseinanderklaffen 
von visueller und auditiver Raumwahrnehmung bringt das Sicherheits- 


400 Subjektivierungen 


gefühl ins Wanken, weil es sich von der Alltagswahrnehmung signifikant 
unterscheidet. 

In Coppolas RuMBLE FısH (USA 1983) verändert eine spezielle künst- 
liche Hallmanipulation, bei der eine lange Nachhallzeit mit einem Gate 
kombiniert wird, die gesamten Dialoge, die in Innenräumen spielen. Das 
Gate ist eine elektronische Schaltung, die nur aktiv wird, wenn das Nutz- 
signal einen bestimmten Pegel überschreitet. Das heißt, nur wenn gespro- 
chen wird, wird auch der Hall zugeführt, der jedoch am Ende des Worts 
abrupt abbricht. Dieser seltsame Effekt von abgebrochenem Hall lässt die 
Figuren wie isolierte Traumwandler erscheinen, die den Bezug zur Reali- 
tät verloren haben, weil ihnen akustisch der Bezug zum Raum abhanden- 
gekommen ist. Die Hallmanipulation erfüllt eine symbolische Funktion 
auf der Ebene der filmischen Erzählung. 


Hall als Mittel der Subjektivierung: 


° LAWRENCE OF ARABIA (GB/USA 1962, David Lean, 3.07.09-3.15.01): 
Die Erschöpfung der Engländer wird ausgedrückt durch das blecherne 
Scheppern gegeneinander schlagender Blechlöffel, das extrem vergrö- 
ßert und verhallt wird. 

e Brrp (USA 1987, Clint Eastwood, 0.10.35-0.19.57): Parker wird in die 
Psychiatrie eingeliefert, Traum von Leichenschauhaus mit verhallten 
und vergrößerten Geräuschen. 

e Rosocor (USA 1987, Paul Verhoeven, 0.55.28-0.58.15): Der smarte 
Jungunternehmer wird im Auftrag des Vizechefs hingerichtet, ext- 
remer Hall auf Stimmen zweier Models, die den Ort fluchtartig ver- 
lassen. 

e Gtory (USA 1989, Edward Zwick, 0.28.19-0.37.09): Die Truppen erhal- 
ten Gewehre; während sie unter Gelächter eine Schlacht mimen, erlebt 
Robert eine Rückblende im Kopf, die sich nur in der Bearbeitung der 
Geräusche ausdrückt. 

° TERMINATOR 2 (USA 1991, James Cameron, 1.02.01-1.17.42): Sarah hat 
eine Vision vom Weltuntergang, die sich mit dem Prolog deckt, Geräu- 
sche selektiv verhallt. 

° THELMA & Louise (USA 1991, Ridley Scott, 1.50.23-2.00.23): Verfol- 
gungsjagd, eingekesselt entscheiden sich Thelma und Louise, in den 
Tod zu fliegen. 

° Tue PIANO (Neuseeland 1992, Jane Campion, 1.55.30-2.00.30): Ada er- 
zählt vom Piano, das im Ozean-Grab ruht. 

° THE PLAYER (USA 1992, Robert Altman): Hall auf Faxgerät (0.41.56- 
0.45.23): Nach dem Mord an Kahane kommt ein neuer Drohbrief an 
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und macht Griffin Mill klar, dass er den Falschen umgebracht hat; 
(1.26.12-1.31.21): Hall auf spöttischem Gelächter im Polizeibüro. 


Zeitlupe 


Zwar ist Zeitlupe ein verbreiteter und gut etablierter formaler Eingriff, 
dennoch findet sich bis heute in der Theorie keine umfassende Behand- 
lung des Phänomens. In einem Aufsatz zu den theoretischen Grundlagen 
der Zeitlupe erwähnt Mary Scott Albert (1996: 7 ff.) eine Reihe von Uberle- 
gungen, die Regisseure wie Eisenstein oder Pudowkin in den 1920er-Jah- 
ren publiziert haben. Sie alle sehen in der Zeitlupe eine Möglichkeit, die 
Aufmerksamkeit der Zuschauer auf Momente mit besonderer Bedeutung 
zu lenken. Diese Texte beziehen sich jedoch hauptsächlich auf den Stumm- 
film, in dem die Zeitdarstellung insgesamt wesentlich flüssiger war. Erst 
die Einführung des Tons standardisierte die Aufnahme- und Vorführge- 
schwindigkeit. 

Möglicherweise hängt dieser Mangel an Theorie damit zusammen, 
dass es in der Literatur keine vergleichbare Technik der Verlangsamung 
gibt und deshalb in der Literaturwissenschaft, die eine der wichtigs- 
ten Quellen der narratologischen Filmtheorie bildet, keine Grundlagen 
erarbeitet wurden. Genette (1972, 1983), der sich eingehend mit den Zeit- 
strukturen im Roman befasst, zieht eine analoge Form der Verlangsamung 
jedenfalls nicht in Betracht. Stam et al. (1992: 121) meinen zum Thema Slow 
Motion lediglich, dass sie den Augenblick vergrößere. 

Dennoch entspricht die Zeitlupe einem Phänomen der Alltagswahr- 
nehmung. Zeit wird selten als statisches Maß erlebt, sondern in Abhängig- 
keit von vielen Faktoren wie Stress, Müdigkeit, Interesse, Freude, Lange- 
weile entweder subjektiv als gedehnt oder als komprimiert empfunden. 
Ohne in die Tiefe dieses Gegenstands eindringen zu wollen - dies ist im 
Rahmen dieser Arbeit nicht machbar -, scheint es einen fundamentalen 
Zusammenhang zwischen der Dichte des Informationsflusses und der 
Zeitempfindung zu geben mit der Gesetzmäßigkeit, dass dichte Momente 
kürzer erscheinen, weil die Aufmerksamkeit auf die Inhalte gerichtet ist, 
während Langeweile dann aufkommt, wenn die Kapazität des wahrneh- 
menden Systems frei für die Zeitempfindung an sich ist (vgl. dazu Pöppel 
1997: 93 f.). Eine Ausnahme von dieser Gesetzmäßigkeit bilden jedoch jene 
Momente, die als schockhaft erlebt werden. Zwar ist der Informationsfluss 
in diesen Augenblicken extrem dicht, und doch scheint die Zeit stillzuste- 
hen. In einem Gespräch kommen der Philosoph Popper und der Hirnfor- 
scher Eccles (1977: 624f.) zum Schluss, dass hier der selbstbewusste Geist 
in einen automatischen Prozess eingreift, um sich in einem Notfall mehr 
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Möglichkeiten zur Entscheidungsfindung zu verschaffen. Zeitlupe kann 
deshalb entweder als mentale Subjektivierung oder als Enunziationsmar- 
kierung interpretiert werden. 

Diese Hypothese wird von der Analyse des Korpus gestützt. In der 
Mehrzahl ist die Zeitlupe Situationen extremer Belastung vorbehalten. 
Besonders der Tod wird seit Beginn der 1980er-Jahre überdurchschnitt- 
lich häufig in Zeitlupe dargestellt. Dabei entsteht ein logisches Problem. 
Die Todessituation wird optisch nur in Ausnahmen aus der Perspektive 
der Sterbenden erzählt, unter anderem in RoBocoPr (USA 1987, Paul Ver- 
hoeven) und in Brrp (USA 1987, Clint Eastwood). Zeitlupe erscheint aus 
dieser Sicht mehr wie ein emotional-dramatisierender Zusatz, der sich 
an der Schnittstelle zwischen hinzugefügtem Kommentar und natürlich 
erscheinender Wahrnehmungstransformation bewegt. Die Achse Tod — 
Zeitlupe ist so stark etabliert, dass die Zeitlupe in der Gegenwart aku- 
ter Lebensgefahr im Rezipienten eine Todesantizipation auslöst. Dieser 
Mechanismus wird zum Beispiel in Dancers WITH WorLvgs (USA 1990, 
Kevin Costner, 0.00.48-0.10.15) mobilisiert. Wenn der schwer verwundete 
Protagonist in der Expositionsszene vor den feindlichen Truppen vorbei- 
reitet, rechnet man als Zuschauer mit dem Tod, der dann allerdings nicht 
eintritt. 

Technisch stellt die Zeitlupe für den Sound Designer eine Heraus- 
forderung dar. Verlangsamt man die Tonaufnahme, entsteht eine wenig 
aussagekräftige Transformation der Frequenzen in den Bassbereich, die 
man analog mit dem Pitchshifter, digital durch Harmonizer-Plug-ins — 
Software-Zusätze in der Workstation - ausgleichen kann. Eine solche 
Gestaltungsstrategie ist die Ausnahme. Sie wird beispielsweise bei Explo- 
sionen oder Schüssen angewendet, die meistens verlangsamt werden, 
damit sie voluminöser erscheinen. Viel häufiger kommen UKOs zum 
Einsatz — undefinierbares Donnern oder Sausen, die an die symbolische 
Dimension von Wind und Donner anknüpfen. Zusätzlich werden die 
Klangobjekte selektiv verhallt, oder sie verschwinden. Eine weitere typi- 
sche Strategie zur klanglichen Zeichnung von Zeitlupe ist die antinatu- 
ralistische Selektion, die in einem eigenen Abschnitt (> 408) behandelt 
wird. 

In jener Szene in THE Prano (Neuseeland 1992, Jane Campion, 
1.30.54-1.39.17), in der George mit dem Beil Adas Finger abhackt, kom- 
men mehrere Techniken zum Einsatz. Die Geräusche verschwinden, extra- 
diegetisch erklingt Adas Klaviermusik — der aufwühlenden Hektik gemäß 
mit vielen Rubati sehr agogisch interpretiert - und bricht im Moment 
des Hackens ab. Zu hören sind die Schreie der Tochter, der Regen extrem 
gedämpft und dann ganz leise Adas verlangsamte Schritte in den Pfützen. 
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Nach einer Pause des Schreckens setzt die Pianomusik wieder ein, leise 
und langsam. 


Tod in Zeitlupe 


PLATOON (USA 1986, Oliver Stone, 1.00.15-1.17.40): Sgt. Barnes er- 
schießt seinen Konkurrenten Set. Elias, die Musik wird im Augen- 
blick des Todes dominant, Bild des sterbenden Sgt. Barnes in Zeit- 
lupe. 

Brrp (USA 1987, Clint Eastwood, 0.01.50-0.10.35): Konzert, Selbst- 
mordversuch. 

Gory (USA 1989, Edward Zwick, 1.31.56-1.47.50): Robert stirbt, Zeit- 
lupe kombiniert mit Stille, Glocken werden in der Musik verankert und 
bewirken die Antizipation des Todes. 

Dances witH Wo tves (USA 1990, Kevin Costner, 1.22.36-1.29.45): 
Büffeljagd; Dunbar gelingt es, einen Büffel gerade noch rechtzeitig ab- 
zuschießen. 


Zeitlupe Subjektivierung 


FIDDLER ON THE Roor (USA 1971, Norman Jewison, 0.40.49-0.53.14): 
Die Gedanken Tevjes werden als Monolog zum Standbild des Metzgers 
geäußert, verhallt. 

RAGING BuLL (USA 1980, Martin Scorsese): (0.29.53-0.31.45): Boxkampf 
La Motta vs. Sugar Ray Robinson, Detroit 1943; (0.36.18-0.37.49): Box- 
kampf La Motta vs. Robinson, Detroit 1943, Niederlage fiir La Motta, 
deutlich bassigere, stärker verfremdete Gestaltung der Geräusche; 
(0.54.29-0.55.46): Boxkampf La Motta vs. Janiro New York 1947, ohne 
Kommentar, die Geräusche insbesondere der Menschenmenge bleiben 
klar definierbar; (1.14.59-1.18.35): Boxkampf La Motta vs. Middle- 
weight Champion Marcel Cerdan, Detroit 1949. 

PLATOON (USA 1986, Oliver Stone, 1.23.00-1.42.23): Zeitlupe mit Weiß- 
blende markiert den Verlust des Bewusstseins. 

BırD (USA 1987, Clint Eastwood): Whiskyflasche fliegt in Zeit- 
lupe durch die Luft (2.09.04-2.27.43): begleitet von Sausen undefi- 
niert; (2.27.43-2.40.42): Folge von Rtickblenden im Augenblick des 
Todes. 

Dances WITH WoLvgs (USA 1990, Kevin Costner): Ein Schwerverwun- 
deter reitet vor den feindlichen Truppen (0.00.48-0.10.15): Während 
der Zeitlupe werden die Geräusche dumpf verfremdet und selek- 
tiv wiedergegeben; (1.02.44-1.04.54): Rückblende, Christine erinnert 
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sich an ihre Kindheit und den Tod ihres Vaters, Todesszene wird in 
Zeitlupe mit stark verfremdeten Geräuschen im Megahall darge- 
stellt. 

° THE SILENCE OF THE LAMBs (USA 1991, Jonathan Demme, 1.36.50- 
1.45.46): Subjektivierung der Zeitempfindung durch albtraumhafte 
Verlangsamung. 

° ORLANDO (GB 1992, Sally Potter, 0.53.43-0.56.00): Verwandlungsszene, 
Orlando wäscht sich in Zeitlupe. 


Vergrößerung 


Werden einzelne Klangobjekte aus dem Umfeld herausgehoben, so lässt 
sich diese Strategie als Vergrößerung bezeichnen. Gegenüber dem sichtba- 
ren Objekt unterscheidet sich das klanglich vergrößerte Objekt durch eine 
Zunahme der Lautstärke; möglicherweisebetont die Verfremdung auch 
die Größe durch eine Transformation in einen tieferen Frequenzbereich. 
Sie ist außerdem häufig an die Zunahme von Hall gekoppelt (> Hall als 
Mittel der Subjektivierung 399). Technisch wird sie in vielen Fällen durch 
eine Substitution erzeugt, das heißt, das sichtbare Objekt wird durch das 
Geräusch einer anderen Quelle ersetzt. Mamoulian beschreibt eine solche 
Substitution: 


In zweiter Linie wollte ich Ton mehr in einer psychologischen als in einer 
realistischen Art einsetzen. Ich war immer begeistert davon, den Ton in einer 
psychologischen Form einzusetzen. Um Ihnen ein Beispiel zu geben: In Love 
ME ToniIcHT [USA 1932] entdecken die Aristokraten, dass Maurice Chevalier 
kein Baron, sondern ein Schneider ist. Die drei Tanten stürzen nach unten, 
wo die ganze Sippe versammelt ist, und Elisabeth Patterson enthüllt das 
Geheimnis. Jemand fragt: «Wie?», und sie antwortet: «Er ist ein gewöhnlicher 
Schneider.» Bei diesen Worten macht sie eine Geste und wirft dabei eine klei- 
ne Vase auf den Boden. Auf den Moment, in dem die Vase auf dem Boden 
aufschlägt, habe ich eine gigantische Bombenexplosion montiert, weil das der 
psychologische Effekt des Geräuschs ist. [...] Das Publikum mochte dieses 
Geräusch, weil es die innere Bedeutung darstellte. (Mamoulian 1980: 91) 


14 «My second priority was to use sound from a psychological rather than a realistic point 
of view. Ihave always been excited about using sound in a psychological manner. To 
give you an example: In Love ME Tonicur the aristocrats discover that Maurice Che- 
valier is not a baron but a tailor. The three aunts dash downstairs where the whole 
clan is assembled, and Elisabeth Patterson announces the discovery. Someone says 
<What?!>, and she says <He’s a common tailor! As she utters these words, she makes a 
gesture and knocks a tiny vase onto the floor. As the vase hits the floor, I dubbed in the 
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Die Vergrößerung betont eine Verschiebung der Wertung eines Gegen- 
stands oder Vorgangs aus der Perspektive der Figur. Wie Metz am Bei- 
spiel aus THE THIRD MAN (USA 1949, Carol Reed) argumentiert, kann man 
solche Vergrößerungen ebenfalls als Enunziationsmarkierungen, genauer 
als objektiv-gerichtete Töne (sons objectifs orientes) interpretieren. Der Film 
stellt ein wichtiges Klangobjekt - in Mamoulians Beispiel den Aufprall der 
Vase — aus, ohne dass sich ein eindeutiger Fokus der Transformation fin- 
den lässt. 

Es ist bezeichnend, dass solche Vergrößerungen im Korpus erst in 
LAWRENCE OF ARABIA (USA 1962, David Lean) wieder begegnen. Dort 
bedeutet das verhallte Scheppern gegeneinanderschlagender Blechlöf- 
fel die halluzinatorische Erschöpfung der Engländer in einer feindli- 
chen Umgebung. Danach taucht das Verfahren ab Mitte der 1970er-Jahre 
gehäuft auf, auffallend und modellhaft zum Beispiel im Vorspann zu 
ALL THE PRESIDENT’S MEN (USA 1975, Alan J. Pakula, 0.00.00-0.01.53), 
in dem einzelne Anschläge der Schreibmaschine durch Schüsse ersetzt 
werden. ALL THE PRESIDENT’S MEN zeichnet in Form eines Politthrillers 
die Ereignisse im Watergate-Skandal nach. Auf metaphorische Weise 
bedeuten die Schüsse die politische Sprengkraft der journalistischen 
Recherche, des journalistischen Texts. Die Modifikation befindet sich 
auf der Ebene des Metadiskurses und ist deshalb eine Enunziationsmar- 
kierung. 


Atmen/Herzklopfen 


Zum Komplex der Vergrößerung gehört auch die Hörbarkeit von Eigen- 
geräuschen der Figur, insbesondere das herausgearbeitete Atmen oder 
Herzklopfen. Chion (1990: 67) hat für diese Kategorie einen eigenen 
Begriff geschaffen: sons internes. Diese Eigengeräusche stellen eine Zwit- 
terfunktion zwischen simulierten und markierten Subjektivierungen dar. 
Als Simulationen sind sie nur denkbar, wenn die Kamera gleichzeitig den 
subjektiven Blick vertritt, optischer und akustischer Standpunkt sich also 
decken. Solche Verbindungen sind eher die Ausnahme. Meist bleiben 
Herzklopfen oder sehr intim aufgenommenes Atmen unabhängig von der 
Kameraposition bestehen. 

Atmen und Herzklopfen haben zudem beide eine symbolische 
Dimension. Sie repräsentieren vegetative Kardinalfunktionen, ohne die es 
kein menschliches Leben gibt. Sie bedeuten deshalb nicht nur Nähe, son- 


sound of an enormous bomb exploding because that is the psychological effect of the 
sound! [...] the audience loved it, because it conveyed the inner meaning.» 
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dern weisen speziell in den Momenten äußerster Bedrohung, in denen sie 
besonders gern zitiert werden, auf das Leben als schützenswertes Gut und 
als Gegensatz zum Tod hin. 

Anhand einer Szene aus PLATOON (USA 1986, Oliver Stone, 0.12.14- 
0.24.59) lassen sich diese Überlegungen konkretisieren. Protagonist die- 
ses Films ist Chris, ein junger, naiver Amerikaner, der soeben in Vietnam 
angekommen ist. Bereits bei der Ankunft auf dem Flughafen beginnt seine 
Begeisterung beim Anblick der massenhaften Leichen in Plastikhüllen zu 
schwinden. Ein unbestimmtes Gefühl von Subjektivierung kommt schon 
dort durch die Montage von Großaufnahmen seines Gesichts mit den stark 
selektiven, negativ gefärbten Bildausschnitten des Flughafens auf. Dieses 
Gefühl wird weiter befördert von Zeitlupenaufnahmen, die sich jedoch 
so geringfügig von der normalen Aufnahmegeschwindigkeit unterschei- 
den, dass auch sie ambivalent bleiben. Als Fokus der Narration erscheint 
Chris zweifelsfrei erst mit dem Einsetzen einer Voiceover, die Chris in Ich- 
Form an seine Großmutter adressiert und die offensichtlich als Lesen von 
Briefen zu verstehen ist. In diesen Briefen thematisiert er sein Gefühl der 
Enttäuschung und Überforderung. Bei seinem ersten Marsch durch den 
Dschungel klappt er erwartungsgemäß zusammen. Im Vordergrund die- 
ser ersten Krise stehen auf der Tonspur das Atmen und die als feindlich 
erlebte Natur, die über die Laute von Ungeziefer — namentlich verschie- 
dener Insekten — und einiger obligater Vogelrufe gezeichnet wird. Bei 
genauer Betrachtung wird deutlich, dass bereits hier die Insekten völlig 
willkürlich platziert sind. Es fehlt jede logisch erscheinende Einheitlich- 
keit. Besonders das schrille Zirpen von Grillen wird nach Belieben zuge- 
mischt und mit dem brutal gleißenden Sonnenlicht assoziiert. Damit sind 
einerseits die Merkmale Reihung und Variation einer Isotopie (> 289) gege- 
ben, die später fortgeführt wird, andererseits sind auch hier die Naturge- 
räusche in erster Linie Spiegel der seelischen Verfassung des Protagonisten 
und somit latent subjektiviert. 

Im Gegensatz zum Atmen setzt das Herzklopfen bei der ersten 
Begegnung mit dem Feind ein (0.19.08). Chris schiebt das erste Mal nachts 
im Dschungel Wache. Über eine Reihe von akustischen Zeichen wird eine 
Katastrophe vorbereitet. Angefangen mit dem drohenden Donner und 
einer Serie von vielfältig variierten Regengeräuschen im Sinne einer Iso- 
topie baut sich eine zunehmende Steigerung auf, die mit dem Aufhören 
des Regens unvermittelt endet. Das abrupte Ende markiert zweierlei: Der 
Diegese zugeschrieben, wirkt es als Regelbruch, der eine unwillkürliche 
Aufmerksamkeitsreaktion auslöst (> 251), die Chris aufweckt; auf der 
Ebene der Enunziation wirkt es als logischer Operand, der einen Zeit- 
sprung kennzeichnet. Beide Lesarten stehen gleichberechtigt nebeneinan- 


Strategien 407 


der. Wiederum sind neben vereinzelten Wassertropfen eine Vielzahl von 
Insektengeräuschen zu hören, die in ähnlicher Weise wie zuvor stärker 
dem Gefühl als der Logik verpflichtet sind. Weiter hört man das Schnar- 
chen des Begleiters und ein undefinierbares bassiges Sausen. Ansons- 
ten ist es unheimlich still. Auf einer Großaufnahme setzt prominent das 
Atmen ein, im Umschnitt ist Chris’ Blick auf den Dschungel im Mondlicht 
zu sehen. Ein undefinierbares Rascheln motiviert den Sprung aus einer 
Großaufnahme in eine extreme Großaufnahme (Abb. 55), in der nur Chris’ 
Augen zu sehen sind. Im Umschnitt löst sich langsam die Silhouette eines 
getarnten Vietnamesen aus den Umrissen der Pflanzen (Abb. 56). Schnitt 
zurück auf die extreme Großaufnahme, das Herzklopfen beginnt als ste- 
reotyp gezeichneter Doppelschlag. 

Die Montagesituation ordnet es zunächst eindeutig Chris zu, dem 
auch der optische Blickpunkt zugeeignet und der somit mehrfach als 
Fokus definiert wird. Es löst sich dann jedoch aus dieser eindeutigen 
Zuordnung und bleibt unabhängig von der Bildeinstellung bestehen. 
Dazu kommt ein undefinierbares Sirren, das klanglich an die Grillen erin- 
nert. Sirren und Herzschlag schwellen parallel an, beschleunigen sich und 
streben dem Höhepunkt, der Eskalation der Gewalt, zu. 

Das Herzklopfen ist hier wie anderswo zeichenhaft überhöht. Wie 
viele andere Stereotype unterscheidet es sich von der realitätsnahen Aus- 
formung. Im Alltag hören wir unser Herz in Stresssituationen oder nach 
physischen Anstrengungen nur vermittelt über das pulsierende Rauschen 
des Blutes, das dem beschleunigten Rhythmus entspricht. Der stereoty- 
pisierte Doppelschlag simuliert ein zweiphasiges Geschehen mit Systole 
und Diastole. 


Antinaturalistische Selektion 


Noch ausgeprägter als im Falle des Herzklopfens ist die Ambivalenz in 
Szenen mit antinaturalistischer Selektion. Als antinaturalistische Selektion 
werden jene Verschiebungen der akustischen Aufbereitung verstanden, in 
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denen sich die einzelnen Elemente der Tonspur graduell gegeneinander 
verschieben, indem einzelne hervorgehoben, andere hingegen zurtick- 
gedrangt werden. Dieses Selektionsverhalten simuliert die Aufmerksam- 
keitsverlagerungen einer wahrnehmenden Figur in Abhängigkeit von den 
spezifischen Interessen und Zielen, die sie verfolgt. Das heißt, die audi- 
tive Aufmerksamkeit wird von psychischen Prozessen gesteuert, deren 
Grundlagen ich im Abschnitt Aufmerksamkeit und Selektion (> 244) aufge- 
arbeitet habe. Dazu gehören das Abscannen einer Lautsphäre nach antizi- 
pierten Ereignissen, das auditive Heranzoomen an ein Klangobjekt sowie 
das fokussierte Hören als Pendant zur optischen Schärfenverlagerung. Im 
Unterschied zur Vergrößerung, die nur einen einzelnen Ausschnitt aus 
der Lautsphäre betrifft, der deutlich vom akustischen Umfeld abgetrennt 
wird, umfasst die antinaturalistische Selektion die gesamte Lautsphäre, 
die sich zumeist in ständiger Fluktuation zu einem als neutral empfun- 
denen Referenzrahmen bewegt. Von der latenten Subjektivierung in der 
Zeichnung von Orten und Materialien unterscheidet sie sich nurgraduell, 
da der formale Eingriff deutlicher eine kommunikative Funktion hat und 
nicht nur einem vagen Gefühl entspricht. 

In den bestehenden theoretischen Rahmen lässt sich dieses Phäno- 
men nur schwer integrieren, wiewohl dieser Rahmen eindeutig eine Hilfe 
zur Beschreibung bildet. Am ehesten kann man es mit dem Begriff semi- 
subjektiv fassen (Metz 1991: 117). Es ist dies eine filmische Ausdrucksform, 
deren mentaler Gehalt einem Protagonisten zugeordnet werden kann, 
deren optischer Blickpunkt aber leicht vom subjektiven abweicht, indem 
der Protagonist noch im Anschnitt zu sehen ist. Man kann sie als men- 
tale, aber nicht als visuelle Subjektivierung im engeren Sinn begreifen. 
Als Beispiel kann die Szene aus CITIZEN KANE (USA 1941, Orson Welles, 
1.42.32-1.52.10) dienen, in welcher Kane unter den Augen seiner Hausan- 
gestellten das Mobiliar im Zimmer seiner Frau zertrümmert. Der mentale 
Blickpunkt wird durch den narrativen Kontext definiert, denn die Szene 
ist Teil der Erinnerung des Butlers und wird als Rückblende präsentiert. 
Sehr viele Beispiele für diese Strategie finden sich in DANGEROUS LIAISONS 
(USA 1988, Stephen Frears), in dem Schärfenverlagerungen der Aufmerk- 
samkeitssteuerung einer Figur entsprechen, wobei diese Figur gleichzeitig 
im Bild zu sehen bleibt. 

Von den objektiv-gerichteten Transformationen unterscheidet 
sich die antinaturalistische Selektion dadurch, dass sie hauptsächlich 
in jenen Filmen vorkommt, deren gesamte Weltsicht von einem einzel- 
nen Protagonisten geprägt ist. Dazu gehören beispielsweise der bereits 
erwähnte PLATOON (USA 1986, Oliver Stone), weiter die Filme ArocA- 
LYPsE Now (USA 1979) und RUMBLE FısH (USA 1983), beide von Fran- 
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cis Ford Coppola, THE Prano (Neuseeland 1992, Jane Campion) und 
vor allem Racıng Buti (USA 1980, Martin Scorsese), der als ein Parade- 
beispiel eingehender analysiert werden soll. Merkmal all dieser Filme 
ist eine über weite Strecken experimentell eingefärbte Filmsprache, die 
sich meist schon in der Exposition entfaltet. Die überaus facettenreiche 
psychologische Tiefe, welche diese Filme auf allen Ebenen der Narra- 
tion ausloten, macht sie zum kreativen Leckerbissen für begabte Sound 
Designer, die ihre wildesten Klangfantasien ausleben können, ohne von 
Konventionen oder kleinkarierten Plausibilitätsüberlegungen gebremst zu 
werden. 

Wegen der konstant nicht neutralen Darstellungsweise ist es schwer, 
eine Irennlinie zwischen Subjektivierung und Stil zu ziehen. Die Stilmerk- 
male ergeben sich ja gerade aus dieser unvermindert subjektiven Haltung. 
In ihren Reflexionen über das Verhältnis von Ich-Film und Ich-Roman 
kommt Brinckmann (1981: 104) zum Schluss, dass «die parteiliche, bedin- 
gungslose Konzentration auf eine Person» genügt, um einen Film zumin- 
dest auf der Schwelle zur Ich-Erzählung zu platzieren. 

Bereits die oben analysierte Messer-Szene aus BLACKMAIL (> 381) 
kann als rudimentärer Versuch einer antinaturalistischen Selektion ver- 
standen werden. Das Wort «knife» tritt als Element aus dem natürlich 
wirkenden Kommunikationsfluss hervor und verdeutlicht die selektive 
Aufmerksamkeit der Protagonistin, die völlig von dem traumatischen 
Erlebnis des Mordes besetzt ist. 

Sehr viel komplexer ist die Situation in RAGING BULL. Die Analyse 
der Subjektivierungsstrategien wird besonders erschwert durch die for- 
mal heterogene Aufbereitung der Erzählung mit einer Vielzahl einander 
überlagernder Techniken, die nicht ohne Weiteres auseinander sortiert 
werden können. Vier unterschiedliche Stilebenen lassen sich zur Kom- 
plexitätsreduktion in diesem Biopic über den Boxer Jake La Motta unter- 
scheiden: 


1. die Titeleinstellung, ein Boxtraining als märchenhafter Tanz inszeniert, 
in Zeitlupe, geräuschlos, nur von der extradiegetischen Musik getra- 
gen 

2. sieben extrem stilisierte Kampfsequenzen 

dokumentarisch wirkende Sequenzen, die Jake als Privatmann zeigen 

4. und schließlich die Simulation einer Homemovie-Montage, die das 
private Familienglück in Super-8-Manier feiert 


g3 


Zunächst zu den Kampfszenen: Sie sind formal keineswegs so homogen, 
wie sie scheinen. Dennoch lassen sich einige Grundpfeiler der Gestaltung 
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ausmachen. Die Zeitgestaltung ist in allen sehr flüssig. Es gibt kein objek- 
tiv wirkendes Zeitmaß. Momente extremer Verdichtung mit beschleunig- 
ter, stakkatohafter Schnittfrequenz werden von zerdehnten Momenten in 
Slow Motion abgelöst. Die Tonspur setzt sich aus einigen Grundelementen 
zusammen, die teilweise den öffentlichen Status der Kämpfe symbolisie- 
ren - es sind dies Applaus, Blitzlichter, die Glocke, Schreie und Pfeifen 
sowie Buhrufe der Menschenmenge -, teilweise den physisch-materiellen 
Aspekt des Körpers betonen - namentlich die elaborierten Faustschläge 
in allen Variationen, die sausenden Windgeräusche der Bewegungen und 
die ekligen, sumpfig-plätschernden Geräusche von aufplatzenden Wun- 
den. Dazu kommen die Stimme des Kommentars — dünn-blechern ver- 
hallt und darum historisch authentisch wirkend - und an wenigen Stellen 
Musik. Die Quintessenz der Subjektivierung bilden jedoch einige UKOs, 
von schrill-verfremdetem Kreischen über dumpfes Sausen bis hin zu 
knurrenden Basslauten. Diese Elemente werden einer ständigen Wand- 
lung unterworfen, die zusammen mit der flexiblen Zeitgestaltung eine 
Grundstimmung von bedrohlicher Instabilität schafft. In merkwürdigem 
Kontrast dazu steht, dass sich doch immer wieder Fixpunkte finden, in 
denen Bild und Ton synchron laufen und realitätsnah wirken. Hingegen 
fehlen PoVs fast völlig, der Protagonist ist häufig im Bild, auch wenn 
die Lautsphäre aus seiner Perspektive gezeichnet wird und die Kame- 
raführung die Wahrnehmungsweise einer physisch involvierten Person 
imitiert. 

Im Gegensatz zu den verdichteten Kampfsequenzen wirken die Sze- 
nen aus Jakes Privatleben roh und unspektakulär. In diesem Gegensatz 
manifestiert sich der Unterschied zwischen Jake dem Star und Jake dem 
unbeholfenen Macho, der den einfachen Alltag kaum bewältigt. Diese 
erzählerische Anlage, die in vielen Biopics zu finden ist - im Korpus bei- 
spielsweise auch in Brrp (USA 1987, Clint Eastwood) -, wird hier jedoch in 
virtuoser Weise genutzt. Im Schatten der pompös überstilisierten Kampf- 
szenen erscheinen die Szenen aus dem Alltag deutlich authentischer, als 
sie bei genauer Analyse sind. Zum Schein der Authentizität tragen das 
trist wirkende, kleinbürgerliche bis neureiche Milieu sowie die reduzierte, 
verschliffene Sprache der Figuren bei. Der Protagonist wirkt wie ein Tier, 
ständig getrieben von seiner schwelenden Kampfbereitschaft, gefangen in 
seiner obsessiven Besitzgier und erbarmungslos gequält von Misstrauen 
und Eifersucht. Die formale Aufbereitung dieser Szenen ist glanzlos, die 
Tonspur - insbesondere die Dialogaufnahmen - klingen teilweise bestür- 
zend schlecht, das Bild wirkt häufig wie zufällig von einem Fernsehrepor- 
ter aufgenommen. Und doch ist alles genauestens ausgeklügelt, jedes Ele- 
ment auf der Tonspur gestylt und mit Raffinesse montiert. Immer wieder 
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sind Formen von antinaturalistischer Selektion aufzuspüren, häufig nur in 
kurzen signifikanten Momenten deutlich wahrnehmbar und zunehmend 
um die fanatisch fixierte Beobachtung seiner Beute - der makellos hellhäu- 
tigen Vickie — zentriert. 


V Modellanalysen 


13 Modellanalyse 1: Uberfluss als Strategie 


JURASSIC PARK 
(USA 1993, Steven Spielberg, 0.00.00-0.03.16) 


Arbeiter laden ein Tier in einem großen Käfig ab, um es in ein größe- 
res Gehege zu leiten. Bei diesem Manöver, das bei Scheinwerferlicht in 
der Nacht stattfindet, kommt es zu einem Unfall. Ein Arbeiter wird von 
dem offensichtlich gefährlichen Tier gepackt und verschwindet. Zur Tier- 
art fehlen zwar genauere Angaben, anhand von Vorinformationen und 
dem Logo Jurassic PARK, das auch auf die Helme der Arbeiter appliziert 
wurde, wird der Zuschauer jedoch auf einen Dinosaurier schließen. Vom 
Tier zu sehen ist in dieser Szene nämlich nur eins: ein Auge, umrandet von 
geschuppter Haut, mit schlitzförmigen Pupillen. 

Die Dauer der Sequenz wird durch das klangliche Kontinuum defi- 
niert, das bereits vor der Handlung einsetzt und den Universal-Vorspann 
sowie die Titel einschließt. 

Jurassic Park war das Produkt von neuen digitalen Technologien. 
Auf der Tonspur lancierte der Film das Format Digital Theater Sound (DTS), 
das die akustische Information auf einer CD enthält; zudem markierten 
die Dinosaurier einen Meilenstein der digitalen Computeranimation. 


Folgende Überlegungen haben zur Wahl dieser Szene für die Analyse 

geführt: 

e Jurassic PARK ist charakteristisch für das Genre des Monsterfilms. In 
einem Fernsehinterview erklärte Spielberg, besonders vom klassischen 
Kinc Kong (USA 1933, Cooper/Schoedsack) beeinflusst worden zu 
sein. Dieses Statement ist teilweise als geschickte PR-Mafsnahme zur 
Verankerung von Nimbus zu verstehen, andererseits sind jedoch ein- 
deutig Parallelen auszumachen, die sich spezifisch bei der Exposition 
des Monsters zeigen. 

° Sensorischer Überfluss - von den einen als Attraktion auf dem geisti- 
gen Niveau von Jahrmarktvergnügen kritisiert, von weiten Teilen des 
Kinopublikums frenetisch begrüßt - ist sicher eines der wichtigsten 
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Merkmale des zeitgenössischen Mainstreamfilms. Diese Strategie steht 
deshalb im Fokus der folgenden Analyse. 

° Die Expositionsszene enthält besonders in der Verknüpfung von Bild 
und Ton eine Reihe von zeittypischen Elementen. 


Die klanglichen Aspekte 
Methodische Überlegungen zu den Messungen 


Die Analyse gründet auf Messungen der akustischen Parameter. In der 
bereits vorgestellten Form habe ich die Frequenzverteilung in einem 
Diagramm mit den Dimensionen Zeit, Frequenz und - farbcodiert — 
Pegel erfasst. Zusätzlich wurde der Pegel A-bewertet gemessen. Dazu 
wurde das akustische Signal über Lautsprecher wiedergegeben und 
mit einem Brüel-und-Kjaer-Messgerät im Sekundentakt aufgezeichnet. 
Diese Rohdaten habe ich sodann in den Schalldruck umgerechnet und 
jeweils über einen Zeitraum von zehn Sekunden progressiv gemittelt, 
um die Zufälligkeit der punktuellen Datenerfassung auszugleichen 
und eine stabilere Kurve zu erhalten. Als Referenz wurde ein Durch- 
schnittspegel von 80 dB angenommen, wie ihn Holman (1997: 209) 
angibt. 

Dieses Verfahren enthält eine Reihe von Ungenauigkeiten, die man 
bei der Auswertung berücksichtigen muss. Erstens ist das Ausgangsmate- 
rial eine Videokassette und keine digitale Kinotonspur. Deshalb ist davon 
auszugehen, dass die Dynamik erheblich eingeschränkt ist. Diesem Nach- 
teil konnte ich dadurch begegnen, dass ich die Pegel mit den erwähnten 
Messungen im Kino (> 226) abgleichen konnte. Zweitens kommt durch 
die Berechnung des Mittelwerts eine Zeitverschiebung zustande, die ich 
im Diagramm ausgeglichen habe, indem ich die erste Pegelspitze zeitge- 
nau an die Daten in der Tabelle angepasst habe. 


Die dynamische Entwicklung der Szene 


Die Tonspur beginnt unter dem Vorspann von Universal. Neben einem 
fein variierten Grillenzirpen sind vereinzelte Vogelrufe zu hören und ab 
0.00.16 ein undefinierbares windähnliches Sausen. Im ersten Abschnitt bis 
0.00.20 bewegt sich der Pegel somit im unteren Bereich. Um 0.00.20 ändert 
sich die Situation drastisch: Verschiedene Klangobjekte - insbesondere ein 
Donner und ein Paukenschlag - setzen mit einem Pegelsprung dreimal 
hintereinander Akzente. Diese Akzentuierung ist im Diagramm (Abb. 57, 
— 416) deutlich sichtbar. 
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57 Pegelentwicklung (A-bewertet; Zeit in Sekunden) 


Danach sind einige Entspannungen zu entdecken. Sie entsprechen 
den Umschnitten auf die schauenden Arbeiter. Dieser Pegelrückgang 
gehorcht stärker der Konvention als der Logik. In der Schnitt-Gegen- 
schnitt-Anordnung muss man räumlich davon ausgehen, dass sich die 
Aufnahmeposition in der Mitte zwischen den beiden Bereichen befindet, 
somit müsste der Pegel konstant sein. Im Klangkontinuum würde im 
Umschnitt eine Drehung der Ereignisse um 180° stattfinden, das heißt, 
in der Einstellung auf die Arbeiter müsste man die Geräusche des Bull- 
dozers im Rücken hören. Die Pegelschwankung korrespondiert deshalb 
mit einer Selektion, die der natürlichen Aufmerksamkeitsverlagerung 
einer schauenden Person, nicht aber den physikalischen Gesetzen ent- 
spricht. 

Der Maximalwert wird erstmals bei t = 116s erreicht und geht auf 
einen durchdringenden Tierschrei zurück. Auf verschiedenen Ebenen 
bedeutet dieser Höhepunkt eine Wende. Zwar sind schon davor einige 
Indizien für die drohende Gefahr vorhanden; der Schrei löst jedoch eine 
deutliche Verhaltensänderung der Protagonisten aus, die respektvoll 
zurückweichen. Das finale Hochplateau mit Maximalpegeln erstreckt sich 
von 164 bis 190 s und umfasst das gesamte Geschehen des Unfalls. 

Als Tendenz lässt sich in der Entwicklung der Dynamik eine kontinu- 
ierliche Steigerung beobachten, in der sich frappierend der Spannungsauf- 
bau spiegelt. Die dynamische Struktur der Szene ist ein bestimmendes Ele- 
ment für die interpretierende Tätigkeit des Zuschauers. Sie führt ihn durch 
ein dichtes Netz komplexer sensorischer Angebote. Indem die Zuordnung 
von Lautstärke Akzente setzt, steuert sie die unwillkürliche Aufmerksam- 
keit. Lautstärke - so wurde in dieser Arbeit postuliert - ist eines der wich- 
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tigsten Elemente, die Rezipienten in einen Reiz-Reaktions-Mechanismus 
zu Zwingen. 


Frequenzverteilung 


Um die Lesbarkeit der Grafik zur Frequenzdistribution (Abb. 58, > 220/ 
221) zu erhöhen, habe ich zusätzlich näherungsweise die Klangobjekte 
eingezeichnet, die den sichtbaren Frequenzverdichtungen (in der Grafik 
gelb bis rot) entsprechen. 

Die fein variierten Grillen zu Beginn der Szene bewegen sich in 
einem oberen Frequenzbereich von 2 bis 5kHz, welcher der größten Emp- 
findlichkeit des Ohrs entspricht (> Grafik isophonischer Hörkurven 200). 
Obwohl leise, ziehen die Grillen aus diesem Grund die Aufmerksam- 
keit auf sich. Die Tier-/Vogelrufe unterstützen diesen Effekt. Eher unter- 
schwellig dürfte deshalb das undefinierbare, windähnliche Sausen wahr- 
genommen werden. 

Mit dem Einsetzen der Pauken - unterstützt von einem noch tiefe- 
ren Grollen - tritt das Bassregister mit seinem vielfältigen mythischen 
und suggestiven Potenzial auf den Plan. Es wird von einer Reihe weite- 
rer Klangobjekte während der ganzen Dauer der Szene genährt. Aus dem 
Strom kaum wahrnehmbarer akustischer Ereignisse schälen sich das wie- 
derholte Knurren des Tiers und einige weitere Tierlaute sowie sporadisch 
ein undefinierbares Grollen heraus. Dort, wo Klangobjekte mit diegeti- 
scher Verankerung fehlen, führt die Musik diese Schiene weiter, besonders 
ein rhythmisierter Bass im °/ -Takt sowie ein liegender bassiger Sound im 
Voice-Stil. Typisch für den unbestimmbaren Charakter des Bassregisters 
ist es, dass die Klangereignisse in diesem Bereich kaum identifiziert wer- 
den können, obwohl aus der objektiven Messung eindeutig hervorgeht, 
dass «etwas» da ist. 

Im mittleren Frequenzabschnitt befinden sich vor allem die mensch- 
lichen Äußerungen — Sprache, Rufe, Ächzen, Schreien - mit zunehmend 
expressiver Qualität, die sich in der wachsenden Intensität spiegelt. Als 
weitere zivilisatorische Klangobjekte gehören das Röhren des Bulldozers 
sowie der regelmäßige Alarm-Buzzer zu diesem Bereich. Spätertritt auch 
dort ein kaum zu entflechtender hektischer Klangteppich von Bläsern an 
die Stelle der diegetischen Klangobjekte, aus dem nur der scharf aufstei- 
gende Bläserakkord um 0.02.26 synchron zum Öffnen des Käfigtors heraus- 
sticht, der sich klanglich an den durchdringenden Tierschrei anlehnt. 

Parallel zum Ansteigen der Gesamtdynamik entfalten sich die Höhen. 
Zwar bewegen sich auch die Grillen in diesem durchdringenden Sektor; 
ihre markerschütternde Kraft entfalten die Höhen jedoch erst in den ver- 
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schiedenen metallischen Klängen - als Gieren oder Quietschen bezeich- 
net —, vor allem jedoch in der durchdringenden Qualität der Tierschreie, 
die sich über das gesamte Frequenzband ausdehnen. Sowohl die Bläser 
mit ihrer Vielzahl an Obertönen als auch die peitschenden Schüsse am 
Ende der Szene spreizen den Frequenzgang bis in jene hohen Gebiete, die 
besonders dann schwer auszuhalten sind, wenn sie mit überdimensiona- 
len Pegeln einhergehen. 

Parallel zur Intensitätszunahme ist ein Auseinanderdriften der Fre- 
quenzen zu beobachten. Besonders die entlegenen Frequenzen in den 
tiefsten Bässen und den höchsten Höhen, die sich außerhalb der durch- 
schnittlichen Alltagswahrnehmung ansiedeln, intensivieren den rein sen- 
sorischen Aspekt. Kombiniert mit der anschwellenden Dynamik verschär- 
fen sie den zwingenden Charakter der exzessiven Reizdimensionen dieser 
Sequenz. 

Die perzeptive Trennung des dichten akustischen Geflechts fällt 
zunehmend schwer. Nur zu Beginn sind einzelne Klangobjekte mit Sicher- 
heit voneinander zu unterscheiden. Mit zunehmender Dynamik löst sich 
die Transparenz des akustischen Geschehens auf. Der gesamte Input kol- 
labiert zu einem monolithischen akustischen Block, dessen Konturen sich 
an den Rändern außerhalb der wahrnehmbaren Reizdimensionen verwi- 
schen. Vorder- und Hintergrund, Bass, Mitten und Höhen verschmelzen 
und zersetzen mit ihrem sensorischen Überfluss die analytische Distanz 
des Betrachters. 


Isotopien 


Über klangliche Verwandtschaften entfalten sich eine Reihe von Isotopien 
(> 289), die sich entsprechend den Gesetzmäßigkeiten des Streaming 
(> 253) in unterschiedliche Frequenzbereiche auffächern. 

Im Bassbereich ist es die Isotopie Pauken-Grollen-Knurren-Bass, die 
über Wiederholung und assoziative Verknüpfung den Aspekt des unbe- 
stimmt Bedrohlichen nähren, von dem eine eigene, äußerst schillernde 
und ambivalente Botschaft ausgeht. In Verbindung mit dem nur vagen 
semantischen Gehalt dieser Sequenz, untermauert vom anhaltend diffu- 
sen Charakter der Klangobjekte, deren Quellen entweder unsichtbar sind 
oder überhaupt nicht identifiziert werden können, wird der Zuschauer in 
der Schwebe gehalten. Eindeutige Anhaltspunkte zum Abbau der Mehr- 
deutigkeit werden ihm immer wieder entzogen. Genauere Informationen 
zu dieser Strategie gehen aus der Analyse der Ton-Bild-Interaktion hervor, 
die diesem Abschnitt folgt. 
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Die zweite essenzielle Isotopie gruppiert sich um das Klangobjekt 
Schrei. Es lässt sich in zwei Untergruppenaufspalten: die Klangobjekte 
metallischer Provenienz und die expressiven Äußerungen von Mensch 
und Tier. Der Käfig als metallene Konstruktion verursacht eine Reihe von 
Geräuschen mit schreiähnlicher Qualität, die als Quietschen und Gieren 
beschrieben worden sind. Ebenfalls metallisch klingen einige Blasinstru- 
mente, deren scharfe Klangqualität besonders im aufsteigenden Akkord 
um 0.02.26 zum Ausdruck kommt. Die Verknüpfung von Menschen- und 
Tierschrei drückt schon hier — wenn auch noch weitgehend unbestimm- 
bar - ein ungleiches Kräfteverhältnis aus, indem das Tier über Intensität 
und weitgefächerte, schneidende Klangdimensionen dominiert. Der röh- 
rende Sound schreibt dem Bulldozer ebenfalls einen schreiverwandten 
Klang zu und ordnet ihn in dieser Hierarchie irgendwo zwischen Mensch 
und Tier ein. 


Ton-Bild-Interaktion 


Der fast exklusiv durchgehaltene Schuss-Gegenschuss-Modus etabliert 
zwei unversöhnliche Antagonisten, die symbolisch für die Begriffe Natur 
und Zivilisation stehen. Die zunehmende Verdichtung des Bildausschnitts 
auf Körperfragmente — zu sehen sind unter anderem der menschliche 
Mund sowie die Augen von Mensch und Tier — visualisiert die Botschaft 
Auge um Auge — Zahn um Zahn (Abb. 59 und 60). 

Auf der Bildebene lässt sich eine ähnliche Vektorisierung auf einen 
Höhepunkt hin beobachten wie bei der Analyse von Dynamik und Fre- 
quenzverteilung. Besonders in diesem mehrfach codierten Streben auf 
einen einzelnen gemeinsamen Fluchtpunkt - die absehbare Katastrophe- 
liegt ein ausgeprägtes verbindendes Moment, das die atomisierte Zerstü- 
ckelung des Ton- und Bildmaterials ausgleicht. 

Zur Analyse des Zusammenspiels von visueller und akustischer 
Repräsentation habe ich ein Sequenzprotokoll erstellt (> 425). Die Num- 
merierung der Einstellungen bezieht sich auf diese Tabelle. 


Orientierung 


Grillen und vereinzelte Vogelrufe etablierenden Dschungel als Schauplatz 
des Geschehens bereits unter dem Vorspann. Spielberg greift damit auf die 
fest verankerte Bedeutung des stereotypisierten Vokabulars von Orientie- 
rungslauten zurück, das ich im Kapitel Orientierung (> 313) beschrieben 
habe. Abgesehen von einigen undefinierbaren, verhallten Tier- oder Vogel- 
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stimmen verschwinden die Orientierungslaute mit Beginn der Handlung 
ab 0.00.48 (Einstellung 5). Als weiteres Element der akustischen Zeichnung 
kann man die spanischen Wortfetzen verstehen, die im Zusammenspiel 
mit den Dschungel-Sounds den Schauplatz geografisch in Mittel- oder 
Siidamerika ansiedeln. 

Bis zuletzt verweigert die bildliche Umsetzung eine eindeutige 
Orientierung. In erster Linie fehlt ein klassischer Establishing Shot, der 
einen Überblick über die räumliche Situation gewähren würde. Die Orien- 
tierungslosigkeit wird verstärkt durch die Dunkelheit und die Position der 
Scheinwerfer, die mit ihrem alles überstrahlenden Gegenlicht mehr ver- 
hüllen als sichtbar machen. 

In diesem unüberschaubaren Gefüge trägt der Titel «Isla Nublar 
120 Miles West of Costa Rica», welcher den fiktionalen Schauplatz einem 
faktisch zu bestimmenden Ort auf der Landkarte zuschreibt, nicht wirk- 
lich zum Verständnis bei, sondern hat mehr die Funktion, Faktizität zu 
behaupten und die neugierige Unruhe des Zuschauers, der zu diesem 
Zeitpunkt wenig versteht, für einen kurzen Moment zu besänftigen. 

Mit Fortschreiten der Handlung verkürzt sich die Dauer der Einstel- 
lungen auf ein bis zwei Sekunden, und entsprechend erhöht sich die Schnitt- 
frequenz. Gleichzeitig werden die Bildausschnitte zunehmend so fragmen- 
tiert, dass kaum mehr etwas zu erkennen ist. Erst im Einzelbildmodus bei 
der Visionierung werden die Details sichtbar und man erkennt, dass eigent- 
lich nichts zu sehen ist außer einer Hand, die verschwindet, einem böse blit- 
zenden Auge und einem überdimensionierten Mund, der einen Befehl bellt. 


Akustische Einfachcodierung: 
Spielbergs Technik, ein Monster zu etablieren 


Spielberg liebt es, unbekannte Wesen mit unbestimmbaren Klängen 
auf der Tonspur zu exponieren. 1975 hatte er dem weißen Hai noch ein 
musikalisches Leitmotiv zugeordnet; 1977 untermauerte er in CLOSE 
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ENCOUNTERS OF THE THIRD KIND die bescheidenen optischen Effekte, 
welche die Außerirdischen darstellten, mit einer pompös-suggestiven 
Tonkomposition; und von E. T. — THE EXTRATERRESTRIAL (USA 1982) 
sind während der ersten acht Minuten nur Bruchstücke im Dunkeln zu 
sehen, die zahlreichen Elemente der Tonspur hingegen verdichten sich 
zu einem komplexen, allerdings noch vagen Puzzle. Mit dieser Strate- 
gie — ich nenne sie in Ermangelung eines etablierten Begriffs akustische 
Einfachcodierung — steht er im zeitgenössischen Kino nicht alleine da. Wo 
immer Fremdheit eine Rolle spielt, wo immer Unbekanntes bedrohlich 
wirkt, setzen Regisseure auf die fantasieerzeugende Macht des Klang- 
objekts. 

Diese Strategie ist nicht so neu, wie es scheint. Bereits in KING KonG 
(USA 1933, Cooper/Schoedsack) wird das Monster über den dumpfen 
Klang seiner Schritte und ein bassiges Brüllen eingeführt, bevor es zu 
sehen ist. Mit der Weiterentwicklung des Tonfilms und seiner Konven- 
tionen, mit der zunehmenden Dominanz des Bildes und dem Wunsch 
nach eindeutigen, leicht verständlichen Erzählstrukturen wurde diese 
Technik wieder zurückgedrängt. Eine seither verfestigte Strategie, das 
Unheimliche einzuführen, ist die anthropomorphe Kamera, die den 
Blick eines unbekannten Fremden suggeriert (Brinckmann 1994: 296 f.). 
Auch diese Form der Codierung ist so etabliert, dass die Zuschauer sie 
ohne Weiteres anhand einiger Merkmale verstehen: leicht verwackelte, 
schweifende Kameraführung, kombiniert mit unscharfen Objekten im 
Vordergrund. 

Beide Strategien fallen in dieser Expositionsszene von JURASSIC PARK 
zusammen. Die Einstellungen 13, 15, 21, 23 und 26 entsprechen dem Point 
of View des Monsters im Käfig. Sie sind entweder mit einem undefinier- 
baren Knurren (13, 21 und 23) oder mit dem durchdringenden Tierschrei 
(15 und 26) kombiniert. Bis zuletzt wird der angstbesetzte Mythos vom 
unbegreiflich Unheimlichen aufrechterhalten, außerdem Auge (Abb. 60) 
bleibt bis zuletzt nichts zu sehen. Diese Form der Ton-Bild-Interaktion 
ist ein wunderbares Beispiel zur Verdeutlichung des Konzepts Mehr- 
wert (> 142). Die Redundanz der Kombination von Käfigschlitz und 
Knurren tendiert gegen Null. Optische und akustische Repräsentation 
stehen in spannungsgeladener Distanz zueinander. Dennoch genügen 
sie den Anforderungen der Randbedingungen, die man als Verbindung 
des Blicks mit der klanglichen Äußerung eines Lebewesens beschreiben 
kann, indem beide über das Merkmal belebt in einen Zusammenhang 
treten. 

Aggressivität und Kraft des Tiers werden immer nur andeutungs- 
weise über Indizes ausgedrückt. Dazu gehört neben der Verquickung 
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von PoV und Sound die Materialitat des Kafigs aus schwerem Metall 
mit winzig kleinen Schlitzen. Die metallischen Geräusche beschreiben 
nicht nur einen schweren, soliden Gegenstand — mit Kettenrasseln mehr 
ein unentrinnbares Gefängnis als ein mobiles Gehäuse -, sondern auch 
einen zivilisatorischen Antagonisten, einen Krieger in Rüstung. Die mili- 
tärisch-aggressive Assoziationskette, die mehr die Potenz des Gegners 
als die menschliche Potenz symbolisiert, wird von der Instrumentierung 
der Musik — Perkussion in Verbindung mit Bläsern - prototypisch ausge- 
baut. Weiter sind die Schreckreaktionen der Protagonisten Indizes für die 
Gefährlichkeit des Tiers. 

Die Strategie, zu verhüllen statt zu zeigen, anzudeuten statt auszu- 
sprechen, greift auf ein solides Fundament zurück: die Antizipation sei- 
tens des Zuschauers. In den Überlegungen zum Priming (> 249) habe ich 
schon darauf hingewiesen, dass das Priming längst vor dem Film einsetzt. 
Zu den Formen der Voraktivierung gehören Werbe- und PR-Maßnahmen, 
der Trailer, Drehberichte und technische Infos sowie — im Falle von Spiel- 
berg ganz besonders — Person und Image des Regisseurs als symbolischem 
Urheber der Erzählung. Mit dem Namen Spielberg ist eine bestimmte Art 
des Kinovergnügens verknüpft, eine unterhaltsame, immer wieder von 
augenzwinkernd humoristischen Einlagen aufgelockerte Kombination 
aus Action und Spannung auf höchstem technischem Niveau. Für ein 
Massenpublikum, das nicht zum cinephilen Kreis der Insider zu zählen 
ist, hat Spielberg neben Hitchcock und George Lucas als einer der wenigen 
Regisseure ein einprägsames, stabiles Image, das mit dem Nimbus eines 
Stars zu vergleichen ist. 

Von Beginn der Szene an greift die Erwartungshaltung. Wenn sich 
die Blätter im grellen Scheinwerferlicht bewegen (Einstellung 5), rechnet 
man schon mit der Anwesenheit eines Dinosauriers, der jederzeit unkon- 
trolliert aus dem Dschungel hervorbrechen könnte. Selbst die unschuldig 
sich drehende Erdkugel im Universal-Logo wird dank dieser Erwartungs- 
haltung - unterstützt von undefinierbarem windähnlichem Sausen - zum 
Omen. Diese latente Anspannung wird weiter auch dann bedient, wenn 
die südamerikanischen Arbeiter apathisch dastehen und die Szenerie 
gelangweilt beobachten (Einstellung 6 und 8). Im Gegensatz zum infor- 
mierten Zuschauer scheinen sie nicht zu ahnen, welche Katastrophe auf 
sie zukommt. Die Tonspur hingegen unterstützt die unterschwellige 
Erwartung der drohenden Gefahr mit dem bestens vertrauten, stereoty- 
pen Grollen, das zu Beginn der Szene leitmotivisch mit dem Titel Jurassic 
PARK verknüpft wurde. 


Die Stellung der Szene im Gesamtgefüge des Films 423 


Die Stellung der Szene im Gesamtgefüge des Films 


Die Antizipation ist der Boden, auf dem die Fantasie wächst. Obwohl nicht 
einmal akustisch unterstützt, meint man zu sehen, wie der Arbeiter vom 
Untier verschlungen wird. Der suggestive emotionale Appell ist ausge- 
prägt, im Vordergrund der Rezeption steht das Gefühl der Angst. Infor- 
mationen werden nachhaltig verweigert. Die Sprache in dieser Szene hat 
kaum semantische, sondern in erster Linie expressive Funktion. Die kur- 
zen Befehle wirken wie stakkatohafte Akzente, welche die Struktur der 
Handlung betonen. 

Tatsächlich ist der erzählerische Wert dieses Ereignisses im Sinne 
eines Informationstransfers minimal. Weder reagiert später jemand im 
Universum der Diegese auf diesen Vorfall, noch wird er jemals erwähnt. 
Erst in der berühmten Kernszene (0.36.38-1.15.19), dem qualvoll lang 
gezogenen Angriff des Tyrannosaurus, wird die angstbesetzte Konfronta- 
tion mit dem Monster wieder eine Rolle spielen. 

Dazwischen liegen eine Reihe von Expositionsszenen, welche einer- 
seits den wissenschaftlichen Hintergrund des Unternehmens etablieren, 
andererseits die Protagonisten und ihre Rollen einführen: den dicken 
Spion, der auf die tiefgefrorenen Dinosaurierembryonen angesetzt ist; den 
besserwisserischen Rechtsanwalt; den düster-existenzialistisch orakeln- 
den Philosophen; den markigen Gründervater und seine naiven Enkel; 
die zukünftigen Sympathieträger, die beiden Paläontologen, die als Exper- 
ten schließlich den Exzess der Natur wieder in die Schranken verweisen 
werden. 

Die Szene hat deshalb vor allem die Funktion, das vegetative Nerven- 
system mit exaltierten Reizdaten zu füttern, die Antizipation zu bedienen, 
die Emotionen zu schüren, um die Durststrecke der komplexen Exposition 
zu überbrücken. Damit steht sie in der Tradition des Prologs, auf die in 
vielen Filmen — besonders bei Spielberg - immer wieder zurückgegriffen 
wird.! 


1 Weitere Beispiele für Prologe mit ähnlicher primär reizorientierter Struktur: 
THE SOUND BARRIER (GB 1952, David Lean, 0.00.00-0.03.31): Ein Pilot rast auf die Erde 
zu und reißt den Steuerknüppel im letzten Moment hoch. 
ALL THE PRESIDENT’S MEN (USA 1976, Alan J. Pakula, 0.00.00-0.01.53): Nixon landet 
und zieht in den Kongress ein; Schreibmaschine mit einzelnen Schlägen extrem ver- 
größert. 
RAIDERS OF THE Lost Ark (USA 1980, Steven Spielberg, 0.00.00-0.12.08): Unbekannte 
Amerikaner auf der Suche nach einem Maya-Idol; die Geräusche beschreiben eine 
Stimmung zwischen Komik und Unheimlichkeit. 
THE RIGHT STUFF (USA 1983, Philip Kaufman, 0.00.00-0.03.09): Testflug endet in 
Absturz. 
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Uber den Transfer von überdimensioniertem Reiz hinaus etabliert der 
Prolog — häufigsymbolischüberhöht - einen Grundkonflikt, hier den Anta- 
gonismus Natur — Zivilisation, und einige Merkmale der formalen Gestal- 
tung, hier das Zusammenspiel einer souveränen Tonspur mit dem Bild, 
die Technik der ambivalenten Andeutung über UKOs, den bassigen Sound 
als leitmotivisch angehauchten Trigger der Antizipation von Bedrohung 
und die Assoziation Metall — Gefahr. 


AMADEUS (USA 1984, Milos Forman, 0.00.00-0.02.34): Salieri schreit, dass er Mozart 
umgebracht habe, und versucht, sich selber umzubringen. 

TERMINATOR 2 (USA 1991, James Cameron, 0.00.00-0.05.02): Nach einer nuklearen 
Katastrophe geht der Kampf einiger Überlebender gegen die Cyborgs weiter. 
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# | Zeit Bild Geräusche Musik Sprache 
1} 0.00.00- | Universal-Logo | Grillen fein 
0.00.20 variiert 
einzelne Vogel- 
rufe 
UKO Sausen 
undefiniert 
2| 0.00.20- | Titel Grollen Pauken 
0.00.29 | Universal undefiniert Chor anschwel- 
lend 
3| 0.00.29- | Titel Grollen Pauken 
0.00.36 | «An Amblin undefiniert Chor anschwel- 
Entertainment lend 
Production» 
4| 0.00.36- | Titel Grollen unde- Pauken 
0.00.48 | Jurassic Park finiert Panflöte 
Sausen undefi- 
niert 
5| 0.00.48- | Baum schwarz | Blätterrascheln 
0.00.56 | nachts Sausen undefi- 
niert 
Krachen von 
Asten 
Tierstimmen 
entfernt verh. 
6| 0.00.56- | GroBaufnahme | Grollen unde- 
0.00.58 | Arbeiter schaut | finiert 
7| 0.00.58- | Palme und Blätterrascheln 
0.01.02 | Baum wanken Sausen undefi- 
im Gegenlicht | niert 
Krachen von 
Ästen 
8| 0.01.02- | mehrere Arbei- | Grollen 
0.01.05 | ter nah schauen | undefiniert 
9| 0.01.05- | Bäume wanken | Grollen unde- 
0.01.08 | im Gegenlicht | finiert 
Krachen von 
Ästen 
10| 0.01.08- | Fahrt auf Wa- Grollen Bass 6/8-rhyth- 
0.01.15 | che mit MG zu | undefiniert misch 
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# | Zeit Bild Geräusche Musik Sprache 
11 | 0.01.15- | Bulldozer bricht | Bulldozer röh- | lang gezogener 
0.01.20 | durch Gebüsch | rend Sound bassig 
Rascheln von 
Blättern 
12 | 0.01.20- | Fahrt und Bulldozer röh- Bläser unter- Rufe verhallt 
0.01.47 | Schwenk mit rend schwellig mit englisch und 
Gabelstapler- Käfig metallisch | bassigem spanisch 
total scheppernd und | Sound im 
Titel: «Isla Nublar | quietschend Voice-Stil 
120 Miles West 
of Costa Rica» 
13 | 0.01.47- | PoV Käfig: Blick | Knurren 
0.01.49 | durch Schlitz 
auf Arbeiter 
14 | 0.01.49- | Fahrt mit Schritte Rufe spanisch 
0.01.56 | bewaffneten Gieren metal- «l want the 
Männern, die lisch chasers on full 
zu Käfig eilen charge!» 
15 | 0.01.56- | PoV Käfig: Blick | Tierschrei schrill 
0.01.58 | durch Schlitz durchdringend 
auf Großauf- 
nahme Arbeiter 
16 | 0.01.58- | Käfig außen Scheppern 
0.02.02 | amerikanisch, metallisch 
Arbeiter wei- 
chen zurück 
17 | 0.02.02- | Chef im Gegen- | Schritte 
0.02.04 | licht von der 
Seite nah 
18 | 0.02.04- | Arbeiter total Gieren metal- 
0.02.06 | schieben Käfig | lisch hoch 
frontal 
19| 0.02.06- | Arbeiter total «...and push!» 
0.02.07 | schieben Käfig 
seitlich 
20| 0.02.07- | Arbeiter total 
0.02.13 | schieben Käfig 
von hinten 
21] 0.02.13- | PoV Käfig: Chef | Knurren «... well and 
0.02.16 | halb nahfrontal loading. Step 
away!» 
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Scheppern 


# | Zeit Bild Geräusche Musik Sprache 
22 | 0.02.16- | Fahrt auf Käfig | Schritte auf 
0.02.22 | zu, Arbeiter Metall 
klettert hoch 
23 | 0.02.22- | PoV Käfig: Blick | Knurren 
0.02.24 | durch Schlitz 
auf GroBauf- 
nahme Arbeiter 
24| 0.02.24- | Chef im Gegen- | Sausen undefi- «Geoffrey, raise 
0.02.26 | licht von der niert the gate!» 
Seite nah 
25| 0.02.26- | Arbeiter total Metalltor bassig | Bläser scharf 
0.02.32 | zieht Tor hoch | angedeutet aufsteigend 
26 | 0.02.32- | PoV Käfig: Blick | Tierschrei Bläser hektisch, 
0.02.34 | durch Schlitz durchdringend | schrill und laut 
aufgleißendes 
Gegenlicht 
27 | 0.02.34- | Käfig beweg 
0.02.36 | sich zurück, 
Arbeiter stürzt 
28 | 0.02.36- | Arbeiter prallt Aufprall dumpf 
0.02.37 | auf 
29| 0.02.37- | Käfig beweg Alarm-Buzzer 
0.02.39 | sich zurück regelmäßig 
30 | 0.02.39- | Arbeiter wird Schrei 
0.02.42 | weggezogen Sausen undefi- 
niert 
31 | 0.02.42- | Käfig total, metallisches 
0.02.44 | Arbeiter mit Scheppern 
Gewehren stür- 
zen heran 
32 | 0.02.44- | Arbeiter wird Schrei 
0.02.46 | weggezogen 
33 | 0.02.46- | Arbeiter klam- | Achzen 
0.02.48 | mert sich fest 
34 | 0.02.48- | Detail Hand Ächzen 
0.02.48 | lässt los Sausen undefi- 
niert 
metallisches 
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# | Zeit Bild Geräusche Musik Sprache 
35 | 0.02.48- | Totale Chef ver- 
0.02.50 | liert den Halt, 
Schwenk hoch 
36 | 0.02.50- | Fahrt auf Chef 
0.02.52 | zu, der wieder 
aufsteht 
37 | 0.02.52- | Totale Käfig 
0.02.56 | außen, Fahrt 
auf Käfig zu 
38 | 0.02.56- | Chef packt 
0.02.56 | Arbeiter noch 
mal 
39| 0.02.56- | Totale Fahrt hin- 
0.03.00 |ter Käfig 
40 | 0.03.00- | Detail Gewehr | Schüsse 
0.03.01 | im Gegenlicht peitschend 
unscharf 
41 | 0.03.01- | Detail Dinosau- | Zischen 
0.03.02 | rierauge undefiniert 
42 | 0.03.02- | Detail Men- Schrei 
0.03.03 | schenauge 
43 | 0.03.03- | Detail Dinosau- 
0.03.04 | rierauge 
44 | 0.03.04- | Totale Käfig Schreie Zischen 
0.03.09 | außen Ächzen Schüsse 
peitschend ver- 
hallt 
45 | 0.03.09- | Detail Mund «Shoot her!» 
0.03.10 
46 | 0.03.10- | Chef nah ver- 
0.03.11 liert die Hand 
des Arbeiters 
47 | 0.03.11- | Detail Mund «Shoooot her!» 
0.03.1 
48| 0.03.12- | Detail Hand 
0.03.16 | rutscht durch 
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THE SILENCE OF THE LAMBS 
(USA 1991, Jonathan Demme, 0.21.31-0.25.40) 


Clarice Starling, Psychologin in Ausbildung zur Profilerin beim FBI, sucht 
das Lagerhaus des schwer psychopathischen Dr. Lecter auf in der Hoff- 
nung, dort auf Spuren seiner Verbindung zum derzeit gesuchten Serien- 
mörder Buffalo Bill zu stoßen. Clarice gelingt es nur mit Mühe, das Tor 
zu öffnen. Der Besitzer des Lagers, ein kauziger, aber distinguierter Gen- 
tleman, hat kaum Informationen über den Mieter. Im dunklen Schuppen 
findet Clarice neben einigen unheimlichen, aber harmlosen Gegenständen 
schließlich einen Leichenkopf in einem Einmachglas, eingelegt in Form- 
aldehyd. 

Die Dauer der Sequenz wird von der Einheit des Schauplatzes defi- 
niert. Entscheidend für das Verständnis der Szene sind jedoch Informatio- 
nen, die man einem Telefongespräch zwischen Clarice und ihrem Vorge- 
setzten Crawford entnehmen kann, das kurz davor stattfindet. 


e Anders als in Jurassıc PARK bedingen in dieser Sequenz narrative 
Dimensionen die Wahl der Klangobjekte. Gleichzeitig und unter der 
Hand sind die klanglichen Aspekte ebenfalls sehr bedeutsam. 

° Die Szene ist als erzählerischer Knotenpunkt zu verstehen, in dem ver- 
schiedene Fäden zusammenlaufen und sich kreuzen. In vorbildlicher 
Weise nimmt die Tonspur ihr weit gestreutes narratives Potenzial wahr 
und trägt Wesentliches zur strukturellen Verknüpfung der Szene mit 
dem dramaturgischen Gesamtgefüge des Films bei. 

e Nicht Überfluss herrscht vor, sondern gezielte Lenkung der Aufmerk- 
samkeit in einem luftigen Klanggebilde, das Platz für nachhaltige Re- 
flexionen lässt. 

e Dennoch ist auch hier die Ambivalenz verschiedener UKOs in Verbin- 
dung mit einem stereotyp bedrohlichen Schauplatz vorhanden. 
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Klangliche Parameter 


Wie im Fall von Jurassic Park sollen die klanglichen Aspekte bei der Ana- 
lyse beriicksichtigt werden, obwohl die Reizdimension nicht im Vorder- 
grund der narrativen Kommunikation mit dem Zuschauer steht. Erstens 
sind diese Parameter nicht so leicht zu entschltisseln, weshalb sie im All- 
gemeinen ausgeblendet bleiben; zweitens sind darin oft sekundäre Bot- 
schaften enthalten, welche für die Interpretation nicht unbedeutend sind; 
drittens sehe ich in der wiederholten intensiven Beschäftigung mit diesem 
Aspekt einen didaktischen Wert. 


Die Entwicklung der Dynamik 


Anders als bei Jurassic PARK liegt für die Analyse keine so aufwen- 
dige Messung des Pegels vor, weil die Dynamik in THE SILENCE OF THE 
Lass keinen so entscheidenden Gestaltungsfaktor darstellt, sondern ich 
beschränke mich auf einen Ausschnitt der Dynamik, den Pegelverlauf bei 
400 Hz (Abb. 61, — 218). 

Die Beschäftigung mit der dynamischen Entwicklung einer Szene ist 
immer auch eine Auseinandersetzung mit ihrer Struktur. Deutlich sind 
zwei Phasen sichtbar, getrennt durch ein «Tal» bei rund 90 Sekunden, dem 
Moment, in dem sich Clarice anschickt, unter dem geöffneten Tor durch- 
zuschlüpfen. Darauf folgt ein weiteres Gespräch zwischen ihr und dem 
Gentleman (Tabelle — 438). Eine zweite Zäsur bei rund 0.02.00 entspricht 
dem tatsächlichen Übergang zwischen Innen und Außen. Sie entspricht 
auch dem Einsatz der Musik. 

Die strukturelle Trennung in zwei Blöcke manifestiert sich auf mehre- 
ren Ebenen. Erzählerisch sind folgende zwei Phasen zu unterscheiden: die 
Vorbereitungen mit dem Versuch, das Tor zu öffnen, und die Erkundung 
des Schuppens durch Clarice allein. Weiter werden die beiden Abschnitte 
durch Musik und Sprache getrennt. Die Vorbereitungen finden während 
eines Dialogs statt, der sich zu weiten Teilen auf die Handlung bezieht. 
In der dunklen, gruselig-surreal wirkenden Welt der verlassenen Objekte 
greift die Musik in das Gesamtgefüge der Tonspur ein, bis sie am Schluss 
überwiegt. 

Insgesamt sind die Pegel klein. Die Szene wird von vorwiegend lei- 
sen Zwischentönen getragen. Höhepunkte sind rund um die Enthüllung 
des Wagens ab 0.02.49 zu entdecken, in dem Clarice den Leichenkopf fin- 
den wird. Sie entsprechen einem gehaltenen Moll-Dreiklang in der Musik 
und dem Zurückschlagen des Sternenbanners, das den Wagen zudeckt. 
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Es folgt noch einmal ein Moment der gespannten Stille, wenn Clarice das 
Innere des Wagens ausleuchtet. Alles — nicht zuletzt das unheilschwangere 
unterschwellige Tremolo in der Musik - deutet auf einen bevorstehenden 
Schock, der dann in zwei Schüben eintritt: Zuerst fällt das Tor mit einem 
überdimensionierten, extrem verhallten Knall zu, dann entdeckt sie den 
ekligen Leichenkopf im Glas. 


Frequenzdistribution (Abb. 62, — 219) 


Zwischen den zwei Phasen Außen und Innen sind auch bezüglich der Fre- 
quenzdistribution deutliche Unterschiede festzustellen: In Phase 1 beherr- 
schen extreme Spreizungen das Bild, während in Phase 2 mittlere Frequen- 
zen von 125 bis 1000 Hz vorherrschen. 

Deutlich sichtbar sind im ersten Abschnitt eine Reihe von bassigen 
Sounds mit Frequenzbündeln um 50Hz. Dazu gehören die Klangobjekte 
Klacken dumpf metallisch entfernt verhallt, Grollen dumpf undefiniert, Türe 
zweimal dumpf klackend sowie die Bassanteile der Autotüren und des Han- 
tierens mit dem Wagenheber. Im zweiten Abschnitt sind die Bässe weniger 
ausgeprägt, jedoch immer noch vorhanden. Sie werden durch das Donnern 
entfernt sowie die Bassanteile des Stoffwegreißens ausgelöst. Gegen Ende 
ist unterschwellig ein UKO zu hören, das ich als Sausen grottenhaft undefi- 
niert und leise beschreibe. 

Im mittleren Frequenzbereich lösen sich Sprache und Musik ab. Die 
Pegelmaxima gehen im ersten Abschnitt jedoch auf die Manipulationen 
an der Türe zurück. Diese Geräusche erstrecken sich über den gesamten 
Frequenzbereich und schieben sich deshalb in den Vordergrund der Wahr- 
nehmung. Die Sprache ist mehrheitlich dezent und zwischen die Geräu- 
sche platziert. Im zweiten Abschnitt erstreckt sich die Musik über rund 
drei Oktaven von etwa 125 bis 1000 Hz. 

In den Höhen sind nur Obertöne und die hohen Frequenzanteile der 
metallischen Geräusche angesiedelt. Zu den metallischen Geräuschen zäh- 
len Anteile der Türen, der Schlüssel und der Wagenheber. Im zweiten Teil 
fehlen Höhen oberhalb von 5000 Hz praktisch völlig. 


Isotopien 


Die klanglichen Parameter definieren zwei Isotopien, die sich auf die 
Komplexe Donner / Grollen / Sausen undefiniert sowie die Klangobjekte 
metallischen Ursprungs verteilen. Eine Besonderheit der Isotopien in THE 
SILENCE OF THE LAMBS ist, dass sie nicht unabhängig von den Dimensio- 
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nen der symbolischen Bedeutung und der leitmotivischen Verkniipfung 
interpretiert werden können. Mit diesen essenziellen Faktoren werde ich 
mich im Kontext der semantischen Aspekte eingehender auseinander- 
setzen. 

Gemäß der verfestigten Bedeutung der Bässe repräsentieren die bass- 
lastigen Sounds auch hier die Macht des Unheimlichen, Bedrohlichen, das 
von der Person Dr. Lecters und - stellvertretend für ihn — seines Schup- 
pens ausgeht. Die Figur Lecter verkörpert unter der Fassade des gebilde- 
ten Psychologen jene Form des Bösen, das dem alltagssprachlichen Begriff 
Wolf im Schafspelz entspricht. Der Schuppen ist weiter ein prototypisch 
unheimlicher Schauplatz - in einem menschenleeren Industriegebiet ange- 
siedelt - und muss selbstverständlich von der weiblichen Protagonistin in 
der Nacht aufgesucht werden. Diese stereotype Anordnung findet ihren 
Ausdruck im bassigen Grollen, das man im Verlauf der Szene retrospek- 
tiv als entfernten Donner identifizieren kann. Wenn überdies die bassigen 
Anteile weiterer Klangobjekte - hier vor allem der Türen - betont werden, 
so mit dem Ziel, sie in diese Isotopie einzuordnen und die bedrohliche 
Seite hervorzuheben. Auffällig ist auch die Klanglichkeit des Halls, der die 
tiefen Frequenzen überproportional verstärkt. Wenn das Tor bei 0.03.44 im 
Hintergrund extrem verhallt zufällt, so sind in der klanglichen Aufberei- 
tung die definierenden Präsenzen getilgt, und es ist nur noch der dumpf 
gefärbte Hall zu hören. 

Die Metall-Isotopie greift ebenfalls — wie in Jurassic PARK — auf die 
etablierten Konnotationen des Metalls zurück. Dennoch ist der aggressive 
Charakter des Materials in dieser Szene ganz anders gefärbt. Nicht der 
kriegerische Aspekt des Metalls als Werkstoff für Waffen und Rüstungen 
bestimmt seine Wirkung, sondern der Aspekt der materiellen Härte. Cla- 
rice arbeitet sich während fast zwei Minuten an diesem Material ab, es 
kostet sie spürbar physische Anstrengung, und sie wird sich daran sogar 
blutig verletzen. Mit wenig Fantasie kann man das Metall als Symbol für 
das männliche Universum interpretieren, eine Interpretation, die durch 
verschiedene Indizien gestützt wird, nicht zuletzt durch das massive Auf- 
gebot von Symbolen auf allen Ebenen der Gestaltung. Das harte Material 
erscheint als Antagonist, an dem sich die zart wirkende Protagonistin 
aufreibt. Latente sexuelle Andeutungen begleiten sie von Anfang an. Ihr 
Vorgesetzter Crawford, der schleimig-widerliche Psychiatriechef Dr. Chil- 
ton und nicht zuletzt Lecter selbst behandeln Clarice mehr oder weniger 
unverhohlen als potenzielles Objekt der Begierde, auch wenn sie selbst 
überhaupt nicht auf diese Andeutungen zu reagieren scheint. Ironischer- 
weise sind die anwesenden Männer - der ältere Lagerbesitzer und sein 
reservierter Chauffeur — nicht in der Lage, ihr zu helfen. Dafür bietet der 
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Vermieter die Hilfe seines Sohnes an. Gerade im Vergleich zu den passi- 
ven, sexuell neutralen Mannern wird die fragile, wenn auch entschlossene 
Weiblichkeit der Protagonistin deutlich. 


Narrative Aspekte 


UKOs zur Beschreibung eines Orts 


Das Lagerhaus liege in einem Industrieviertel von Baltimore, meint Cla- 
rice am Telefon und ordnet dem Schauplatz damit einen geografisch defi- 
nierten Ort zu. Wie in JURASSIC PARK stellt auch THE SILENCE OF THE LAMBS 
ein faktisch anmutendes Raster von Bezugspunkten zur Verfügung, das 
über Dialoge oder Titel kommuniziert wird. Darin äußert sich die Gesetz- 
mäßigkeit, dass wahnwitzige, am Rande der Glaubwürdigkeit angesie- 
delte Erzählungen besonders darum bemüht sind, die Illusion in einer 
eindeutig erscheinenden Wirklichkeit zu verankern. Gleichzeitig befreien 
sprachliche Informationen die Tonspur von der Pflicht, einen Ort geo- 
grafisch zu platzieren. Stattdessen können die Orientierungslaute mehr 
den affektiven Gehalt des Schauplatzes ausdrücken. 

In dieser Szene sind es vor allem drei Klangobjekte, welche als Orien- 
tierungslaute infrage kommen: das Klacken dumpf metallisch entfernt ver- 
hallt, Zughupe entfernt und Hintergrundrauschen undefiniert entfernt. Ent- 
sprechend der etablierten Strategie des Priming sind sie vor allem zu 
Beginn der Szene zu hören. Sie werden jedoch später wiederholt, das Hin- 
tergrundrauschen bleibt sogar während der ganzen ersten Phase mehr 
oder weniger bestehen. Nur die Zughupe ist einer eindeutigen Quelle 
zuzuordnen. Mit ihrer ominösen Bedeutung diffusen Unbehagens, mit 
ihrer Geschichte als Orientierungslaut zur Zeichnung von verlassenen 
Gegenden, in denen gehäuft Mord und Totschlag stattfinden, habe ich 
mich im Kapitel Orientierung (> 314) auseinandergesetzt. Diese stereo- 
type Bedeutungsebene wird auch hier aufgeboten und erzeugt ein nebu- 
löses Gefühl der Bedrohung. Die Ambivalenz der Situierung wird noch 
verstärkt durch die anderen beiden Orientierungslaute, die zur Klasse 
der UKOs gehören. Unter dem Klacken stellt man sich ein Geräusch vor, 
das seine Quelle möglicherweise in einem industriellen Betrieb hat; es 
hat einen unwirtlichen technischen Charakter. Das Hintergrundrauschen 
ist noch diffuser. Es könnte vom Verkehr im Stadtzentrum von Baltimore 
stammen, hat in dieser Szene jedoch vor allem die Funktion, die Leere des 
umliegenden Geländes zu verdeutlichen. Insofern ist auch wichtig, dass 
menschliche oder tierische Laute in diesem Umfeld — abgesehen von jenen 
Geräuschen, die mit der Handlung verknüpft sind - fehlen. 
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Der Schauplatz wird von einer düsteren, leicht irrealen Atmosphäre 
bestimmt, die vor allem eines ausdrückt: Verlorenheit und Kälte. Alles ist 
weit weg an diesem Ort. Das transparente luftige Klangbild mit einem 
Maximum an Extension bis in den fernen Hintergrund vermittelt das 
Gefühl von bodenloser Einsamkeit in einem radikal unbelebten Nie- 
mandsland. Die visuelle Repräsentation des Ortes verstärkt diesen Ein- 
druck zumindest teilweise. Erstens ist es düster, zweitens ist da und dort 
im Gegenlicht Dampf zu sehen, der in einer Art Negativdefinition Kälte 
anzeigt. Überdies sind die Protagonisten dick vermummt, was ebenfalls 
einen Hinweis auf die Temperatur liefert. Hingegen fehlt die distanzierte 
Totale, welche das Subjekt in seiner relativen Kleinheit einer großen men- 
schenleeren Umwelt gegenüberstellen würde. Diesen Bedeutungsaspekt 
liefert die Tonspur allein. 


Symbole 


Den Türen kommt in diesem Umfeld eine besondere, symbolisch vertiefte 
Bedeutung zu. Als Symbole der Abgrenzung und des Übergangs habe ich 
sie im Abschnitt Symbole (> 173) hinsichtlich dieses Films besprochen. In 
der Fallstudie Türen (> 113) habe ich ihre außerordentliche klangliche Viel- 
falt dargestellt. Unüberhörbar nimmt die Türe in diesem Film eine privi- 
legierte Position ein, die speziell in dieser Szene deutlich wird. Der symbo- 
lischen Überhöhung entspricht die perzeptiv auffällige Ausarbeitung des 
Tors als eines gigantischen Monstrums. 

In der ersten Phase der Szene stehen die handlungstragenden Geräu- 
sche neben dem Dialog isoliert da. Zwischen ihnen und dem Hintergrund 
klafft eine deutlich wahrnehmbare Distanz; es gibt kein Klangkontinuum, 
das Vorder- und Hintergrund miteinander verbinden würde. Die Auf- 
merksamkeit des Zuschauers wird über die Sparsamkeit und perzeptive 
Trennung der Schichtung auf die Handlung und vor allem auf die Objekte 
in der Handlung konzentriert. Das Tor als Klangobjekt schiebt sich via 
Lautstärke und Volumen sowohl im ersten Teil, wenn es geöffnet werden 
muss, als auch im zweiten, wenn es im Hintergrund zufällt, in den Vorder- 
grund der Wahrnehmung. 

Als Symbol der Abgrenzung trennt das Tor zwischen Außen und 
Innen. Dieser räumlichen Trennung entspricht eine strukturelle Trennung 
in der Narration. Außen und Innen unterscheiden sich auf mehreren Ebe- 
nen — besonders auch klanglich — deutlich voneinander. Sie repräsentieren 
zwei verschiedene Welten, zwischen denen kaum eine Verbindung zu ent- 
decken ist. 
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Das Tor leistet einen überdimensionierten Widerstand. Mit den übli- 
chen Mitteln ist es nicht zu öffnen, sondern muss aufgebrochen werden. 
Von unaufhaltsamer Neugierde getrieben, wendet die Protagonistin ein 
Maximum an Kraft und List auf, um dieses Hindernis zu bezwingen, 
hinter dem sich — wie sie richtig vermutet — ein Geheimnis verbirgt. Das 
Geheimnis, die Domäne der Privatheit sind ein ständiges Thema des Dia- 
logs. Die Türe markiert somit auch eine Grenze zwischen öffentlichem 
und privatem Leben, die nicht leichtfüßig überschritten werden kann. 
Deshalb gleicht das Überwinden dieser Schwelle mehr einem Eindringen, 
das sich nicht ohne Wunden vollziehen lässt. 

Als Symbol des Übergangs kann das Tor im Kontext der Entwick- 
lungsgeschichte gelesen werden, die in dieser Erzählung mehrfach ange- 
legt ist. Die Protagonistin befindet sich in einem Stadium der Wandlung, 
in dem sie Altes zurücklassen und Neues entdecken will. Das Alte sind 
ihre Herkunft und ihre Kindheitstraumata, der Tod ihres Vaters und die 
Schlachtung der Lämmer. Um den sexuellen Subtext fortzuspinnen, der 
oben angesprochen wurde, betrifft die Türsymbolik auch den Übergang 
vom Mädchen zur Frau. Die geschlechtsneutrale Art, mit der sich Clarice 
inmitten lüsterner Anspielungen bewegt, ist auch Ausdruck einer noch 
unreifen Weiblichkeit. Als kindhaft naives Wesen nimmt sie diese Bot- 
schaften gar nicht wahr. Sie wirkt vielmehr wie eine jungfräuliche Muster- 
schülerin, die vollständig von ihrem vordergründigen Ziel, sich im Beruf 
zu profilieren, absorbiert ist. Lecter als geschulter Psychologe durchschaut 
diese Fixierung und instrumentalisiert sie. Er macht sich Clarice gefügig, 
indem er ihr Informationen verspricht. 

Viel obsessiver als Clarice bemüht sich Buffalo Bill, der zweite Pro- 
tagonist im Stadium des Übergangs, Frau zu werden. Im Gegensatz zu 
Clarice, die sich streng an die gesellschaftlichen Konventionen hält, stellt 
seine Art des Übergangs eine monströse Form der Transgression zivilisa- 
torischer Normen dar. 

Ironischerweise versagt der Schlüssel in den Händen von Clarice. 
Als Symbol der Vollmacht, die er seinem Besitzer verleiht, kann er des- 
halb nicht interpretiert werden. Vielmehr scheint seine Symbolik in der 
Tradition des Märchens zu stehen. «Im Märchen kann der Schlüssel den 
erschwerten Zugang zu Geheimnissen und Schätzen andeuten», schreibt 
Lurker (1991: 650). Dieses Motiv der trügerischen Vollmacht bleibt bis 
zum Ende bestehen, wenn sich Clarice - schlotternd vor Angst - im Verlies 
von Buffalo als Beamtin des FBI deklariert, um dem eingekerkerten Opfer 
Zuversicht zu geben. Das Geräusch des Schlüssels ist außerdem Clarice’ 
Vaterzugeordnet, einem Polizisten, der von zwei Kriminellen erschossen 
wurde. Die Verbindung Schlüssel — Polizist ist so verfestigt, dass man sie zu 
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den Stereotypen zählen kann. In diesem Film kommt als weitere Dimen- 
sion der Vergleich von Clarice’ Arbeit mit der Arbeit ihres Vaters dazu, 
den Lecter im Dialog herstellt, indem er ihre Leistungsmotivation auf den 
Wunsch zurückführt, aus beengten Verhältnissen zu fliehen, die dreckige 
Arbeit des Kleinstadtpolizisten hinter sich zu lassen und in den Olymp des 
FBI aufzusteigen. 

Als weiteres Symbol in dieser Szene ist Donner zu nennen. Donner in 
der etablierten Symbolbedeutung als mahnendes Strafgericht einer göttli- 
chen Instanz (> Donner 356) kann ohne Weiteres in die Interpretation inte- 
griert werden. Denn er spielt erst dann eine Rolle, wenn Clarice die magi- 
sche Schwelle ins Reich der verbotenen Geheimnisse überschritten hat. 


Dramaturgische Verknüpfung 


Das Lagerhaus stellt eine Schnittstelle zwischen Dr. Lecter und Buffalo Bill 
dar. Es ist eine Station auf dem Weg, den Clarice zur Aufklärung ihres Falls 
bewältigen muss. Um diesen Weg erfolgreich zu beschreiten, muss sie 
Geheimnisse lüften und Rätsel lösen. Die Szene rund um die Erforschung 
des Lagerhauses verkörpert als Mikrokosmos einen wichtigen symboli- 
schen Aspekt des ganzen Films in komprimierter Form. Die Gestaltung 
der Tonspur unterstützt den Bedeutungstransfer optimal, indem sie die 
Klangobjekte strategisch anordnet. Oberste Priorität hat in diesem Kon- 
zept die überlegte Wahl des Klangobjekts und die exakte Arbeit am klang- 
lichen Detail. 

Die beiden Isotopien Metall und bassige Laute schaffen eine klangliche 
Verbindung zur Psychiatrie, in welcher Dr. Lecter einsitzt, und verzahnen 
damit die beiden Schauplätze, indem sie die affektiven Qualitäten assimi- 
lieren. Zusätzlich bindet der Regen als kontinuierliches Klangobjekt die 
Szene zeitlich an die nachfolgende Sequenz an, in der Clarice Lecter mit 
empörter Verve in die Zange nimmt, um die Herkunft des Leichenkop- 
fes zu klären. Lecter riecht das Blut aus Clarice’ Wunde, er thematisiert 
die Lüsternheit Crawfords und die sexuelle Transformation, die auch das 
Opfer im Lagerhaus, einen ehemaligen Patienten Lecters, programmatisch 
beherrscht hatte. 

Eine Reihe von weiteren, leitmotivisch anmutenden Verknüpfungen 
schaffen große dramaturgische Bögen. Das Sausen grottenhaft undefiniert 
und leise wird immer wieder bei Clarice’ Treffen mit Dr. Lecter zu hören 
sein, zunächst bei dem folgenden Besuch, wenn Lecter über seinen Zellen- 
nachbarn spricht, den er vor Kurzem ermordet hat. Es ist im Allgemeinen 
so unauffällig, dass es kaum bewusst wahrgenommen werden dürfte. Nur 
einmal, als Clarice Lecter im provisorischen Gefängnis besucht und die 
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Lämmergeschichte erzählt (1.02.22-1.10.33), steht es isoliert da. Als meta- 
diegetisches Klangobjekt vertritt es den Wind, der in jener kalten Nacht in 
Montana geweht hat, als die Lämmer geschlachtet wurden. Es erfüllt des- 
halb die Anforderungen an ein Leitmotiv nicht: Weder ist es strategisch 
platziert, noch obligatorisch und dauerhaft mit einer Figur oder Situation 
verbunden. 

Eine andere Schiene dramaturgischer Anbindung eines Klangob- 
jekts an den weiteren narrativen Kontext stellen die Stoffgeräusche dar. 
Auffällig sind sie schon an sich, weil Stoff als Material eine äußerst sel- 
tene Erscheinung auf der Tonspur ist. Stoff, wann immer er später in THE 
SILENCE OF THE LAMBS zu hören sein wird, ist Buffalo Bill zugeordnet. Am 
nachhaltigsten wird diese Verbindung in der ekelhaften Szene etabliert, 
als Bill das Kleid seines Opfers aufschneidet, um sich an den immensen 
Hautmassen von dessen Rücken zu erfreuen (0.30.08-0.33.19). Die Stoff- 
schiene wird kurz darauf bei der Obduktion eines früheren Opfers stabili- 
siert (0.39.22-0.44.00). Erst gegen Ende wird man diese Fixierung auf den 
Stoff verstehen, wenn man begreift, dass Bill seine Opfer nur dazu benützt, 
um aus ihrer Haut ein weibliches Kostüm zu schneidern, das seine eigene 
männliche Erscheinung verhüllt. Die Anwesenheit der Stoffgeräusche 
in Lecters Lager verschweißt die Lecter- mit der Buffalo-Bill-Geschichte. 
Wenn Clarice’ Hose reißt, so ist die klangliche Verwandtschaft zum Stoff- 
zerschneiden nicht zu überhören. Auch diese Verbindung ist kein Leitmo- 
tiv im engeren Sinn, sondern erschließt sich überhaupt erst retrospektiv 
bei der genaueren Analyse. Denn zu diesem Zeitpunkt weiß man noch 
nichts von Bills Stoffobsession. Die dramaturgische Struktur gibt immer 
nur klein portionierte Indizien frei, die man mit Clarice nach und nach zu 
einem Ganzen zusammenfügt. 

Zuletzt noch ein Blick auf das Klangobjekt Atmen, das in dieser Szene 
als Keuchen zu hören ist. Wechselweise hört man Lecter, Bill, Bills Opfer 
und Clarice atmen. Darin ist kein eindeutiges Muster zu erkennen, außer 
vielleicht eine Tendenz, das Atmen aus dem Umfeld zu lösen und ganz 
vorne zu platzieren. Clarice’ Atmen nimmt jedoch eine privilegierte Stel- 
lung ein, die in ihrer vollen Bedeutung erst im Showdown erkennbar ist, 
wenn es das einzige Geräusch in der beklemmenden Stille darstellt. Erst 
dort verdichtet es sich zum Ausdruck für ihre bedrohte Existenz, als sie 
allein im Infrarot-Visier des pathologischen Mörders durch den Keller irrt, 
ohne selbst etwas zu sehen. 
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Tabelle THE SILENCE OF THE LAMBS 


# | Zeit Bild Geräusche Musik Sprache 
1 | 0.00.00- | Starling nah, STARLING: 
0.00.05 | am Telefon «...and there 
is a Yourself 
storage faci-lity 
right outside 
down town Bal- 
timore, Sir —» 
2 | 0.00.05- | Schwenk mit Klacken dumpf LAGERBESITZER: 
0.00.20 | Fahrt von Schild | metallisch ent- «... at least for 
«Yourself Sto- | fernt verhallt ten years, pre- 
rage» auf Tor Zughupe ent- paid in full... 
total fernt se contract was 
Hintergrund- in se name of 
rauschen unde- a Miss Hester 
finiert entfernt Mofet...» 
Schlüssel metal- STARLING: « and 
lisch klingelnd nobody was 
Rütteln an Tür- ever here since 
schloss 1980?» 
Grollen dumpf LAGERBESITZER: 
undefiniert «Not to my 
Keuchen leise knowledge! ... 
Jaulen undefi- 
niert entfernt 
Schlüsselbund 
klirrend auf Bo- 
den legen 
3 | 0.00.20- | Lagerbesitzer Rutteln an ... Privacy is a 
0.00.24 | halbnah Turschloss mit greatconcernto 
metallischem my customers.» 
Klingeln 
4| 0.00.24- | Starling nah, Türe zweimal STARLING: «Yes, 
0.00.32 | Overshoulder dumpf klackend | won't disturb 
Lagerbesitzer anything, | pro- 
mise. I'll be out 
of here before 
you know it.» 
LAGERBESITZER: 
«May | 
helpyou?» 
STARLING: «Yes, 
actually...» 
5 | 0.00.32- | Detail Hände Rütteln an Tür- 
0.00.36 | rütteln am schloss 
Schloss 
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# | Zeit Bild Geräusche Musik Sprache 
6 | 0.00.36- | Starling nah, Türe zweimal STARLING: 
0.00.39 | Overshoulder dumpf klackend «Stuck.» 
Lagerbesitzer 
7 | 0.00.39- | Lagerbesitzer LAGERBESITZER: 
0.00.41 halbnah «You could re- 
turn tomorrow 
with my son.» 
8 | 0.00.41- | Starling nah, Keuchen STARLING: 
0.00.45 | Overshoulder «What about 
Lagerbesitzer, him?» 
Schärfenver- 
lagerung auf 
Lagerbesitzer, 
der zurück- 
schaut 
9| 0.00.45- | Chauffeur halb- | Klacken dumpf LAGERBE- 
0.00.49 | nah im Auto metallisch ent- SITZER: «| would 
fernt verhallt ask my driver to 
help you, but 
he detests phys- 
ical labor.» 
10 | 0.00.49- | Starling nah, Klacken dumpf 
0.00.57 | Overshoulder metallisch ent- 
Lagerbesitzer, fernt verhallt 
Scharfenver- Zughupe ent- 
lagerung auf fernt zweimal 
Lagerbesitzer, 
der Starling 
nachschaut 
11] 0.00.57- | Starling total Klacken dumpf 
0.01.06 | geht zu ihrem metallisch ent- 


Wagen 


fernt verhallt 
Zughupe ent- 
fernt zweimal 
Wagentüre 
klackend auf 
und zu 
Schlüsselbund 
metallisch klin- 
gelnd 
Kofferraum öff- 
nen klackend 
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# | Zeit Bild Geräusche Musik Sprache 
12 | 0.01.06- | Detail Wagen- | Wagenheber 
0.01.08 | heber von auf Asphalt 
innen metallisch 
schleifend 
Ture dumpf 
klackend groB 
13 | 0.01.08- | Schwenk von Wagenheber 
0.01.16 | Wagenheber metallisch 
auf Starling nah | scheppernd 
Keuchen 
Wagenheber 
rhythmisch 
quietschend 
Ture dumpf 
klappernd 
rhythmisch 
14 | 0.01.16- | Detail Wagen- | Wagenheber 
0.01.20 | heber von rhythmisch 
innen quietschend 
15 | 0.01.20- | Starling und Wagenheber 
0.01.24 | Lagerbesitzer rhythmisch 
vor Tor total quietschend 
16 | 0.01.24- | Starling nah, Türe dumpf kla- STARLING: 
0.01.28 | Overshoulder ckend verhallt «Stuck! Do you 
Lagerbesitzer zweimal handle me that 
Metallstab fällt flashlight, Sir?» 
klirrend zu 
Boden 
17 | 0.01.28- | Lagerbesitzer Schuhe knir- 
0.01.30 | nah schend auf 
Asphalt 
18 | 0.01.30- | Starling nah Kleiderrascheln 
0.01.37 | legt sich hin Keuchen 
Grollen unde- 
finiert 
Klacken metal- 
lisch entfernt 
verhallt 
19| 0.01.37- | Starling groß Sausen bassig 
0.01.39 | von innen leise 
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Taschenlampe 


# | Zeit Bild Geräusche Musik Sprache 
20 | 0.01.39- | Starling liegend, | Keuchen STARLING: «... if 
0.01.51 | amerikanisch Visitenkarte this door should 
leise raschelnd fall down or an- 
ything ... this is 
the number of 
our Baltimore 
field office...» 
21| 0.01.51- | Lagerbesitzer «... Now, they 
0.01.53 | groß know you're 
with me. You 
call them, if 
anything should 
happen.» 
22 | 0.01.53- | Starling liegend, LAGERBESITZER: 
0.01.56 | amerikanisch «Yes, Miss...» 
23 | 0.01.56- | Starling groß Ächzen metal- | Streicher und 
0.02.04 | von innen, lisch Bläser leise in 
Schwenk auf Stoff zerreißt Moll, minima- 
das Knie mit Keuchen listisches Motiv 
einer Wunde mit Flöte und 
Harfe 
24 | 0.02.04- | Lagerraum Donner entfernt | Dreiklang Moll 
0.02.12 | dunkel total mit | Rascheln un- ausgehalten 
Starling definiert leise 
25| 0.02.12- | Starling nah Rascheln un- 
0.02.18 definiert leise 
Schritte knir- 
schend leise 
26| 0.02.18- | PoV Starling, Regen leise 
0.02.22 | Bewegung auf | plätschernd 
eine Vogel- 
skulptur im 
Schein der 
Taschenlampe 
27 | 0.02.22- | Starling nah Schritte knir- 
0.02.26 schend leise 
28 | 0.02.26- | PoV Starling, Regen stärker, 
0.02.29 | Bewegung trommelnd 
über Schau- 
fensterpuppen 
auf Klavier 
im Schein der 
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# | Zeit Bild Geräusche Musik Sprache 
29 | 0.02.29- | Fahrt mit Star- | Schritte knir- 
0.02.35 | ling seitwärts schend leise 
30 | 0.02.35- | Lagerraum Donner entfernt 
0.02.45 | dunkel total mit 
Starling, Licht 
der Taschen- 
lampe fällt auf 
Sternenbanner 
über Auto 
31 | 0.02.45- | Bewegung mit | Schritte knir- 
0.02.49 | Starling nah, schend leise 
frontal 
32 | 0.02.49- | PoV Starling, Regen rau- 
0.02.52 | Bewegung über | schend 
Sternenbanner 
im Schein der 
Taschenlampe 
33 | 0.02.52- | Starling halb- 
0.02.56 nah 
34 | 0.02.56- | Autoscheibe Stoff wegreißen | Tremolo löst 
0.03.08 | von innen, Licht | Rütteln an Motiv ab 
fällt durch das | Autotür metal- 
Sternenbanner, | lisch 
das Starling 
plötzlich weg- 
reißt 
35 | 0.03.08- | Autoscheibe Autotür öffnen 
0.03.58 | von innen, Licht | mit Knarzen 
fällt durch blau- | Stoff (Taschen- 
en Vorhang, tuch) leise 
Starling steigt Regen rau- 
ein, Schwenk schend im 
mit Taschen- Hintergrund 
lampe über Tor zufallen mit 
Rücksitz zurück | dumpfem Knall 
auf Starling im Megahall 
Sausen grotten- 
haft undefiniert 
und leise 
36 | 0.03.58- | Detail rotes Sausen grotten- | Streicher disso- 
0.04.00 | Tuch haft undefi- nant anschwel- 
niert, etwas lend 
lauter 
37 | 0.04.00- | Detail Leichen- | Verschwunden | Streicher disso- 
0.04.10 | kopf in Glas oder von Musik | nant mit Gong 
zugedeckt 
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THE RIGHT STUFF 
(USA 1983, Philip Kaufman, 0.05.07-0.06.27) 


Zum Schluss möchte ich noch einen persönlichen Favoriten analysieren, 
keine ganze Szene, sondern nur einen kleinen Kern, der nicht mehr als 80 
Sekunden dauert. 

THE RIGHT STUFF baut zu weiten Teilen auf einer Parallelhandlung 
auf, die in zwei unterschiedlichen Zeitebenen angesiedelt ist. Der eine 
Erzählstrang thematisiert den Versuch von Testpiloten, Ende der 1940er- 
Jahre die Schallmauer zu durchbrechen; die zweite Handlung beginnt 
nur wenig später, 1953, und umfasst ein knappes Jahrzehnt, in dem sich 
die ersten amerikanischen Astronauten auf den Flug ins Weltall vorberei- 
ten. Zwischen den beiden Ebenen entfaltet sich mehr und mehr ein Wer- 
tungsgefälle, in dem die Testpiloten als Helden gefeiert werden, während 
die Astronauten wie passive Versuchskaninchen nur den Zweck erfüllen, 
im Umfeld des Sputnikschocks die technologische Vormachtstellung der 
Amerikaner zu sichern. 

Der Film entwirft in mehreren Parallelmontagen Vergleiche und abs- 
trakte Konzepte. Unter anderem wird die Assoziation Versuchstier — Astro- 
naut über die Montage analoger Situationen - Affen und Astronauten 
in gleichen Trainingsabläufen — geschaffen und die Lächerlichkeit fehl- 
schlagender Raketenstarts über eine serielle Montage konstruiert, die ins 
Geräusch Flasche entkorken mündet. Eine weitere Parallelmontage habe ich 
im Kapitel Subjektivierungen (> 297) beschrieben: Während der Testpilot 
Yeager in den Tod zu rasen scheint, findet ein pompöser Festakt zu Ehren 
der Astronauten statt. 

Innerhalb des Korpus wirkt THE RIGHT STUFF sehr experimentell. 
Wie RAGING BuLL (USA 1980, Martin Scorsese), der übrigens von der glei- 
chen Firma — Chartoff-Winkler — produziert wurde, versucht er die tradi- 
tionellen Grenzendes eher konservativen Genres Biopic zu sprengen. Im 
Gegensatz zu Scorsese gelingt es Kaufman jedoch nicht, die dispersen sti- 


444 Modellanalyse 3: Interaktion von Geräusch und Musik 


listischen Elemente in ein geschlossenes Konzept zu integrieren. Während 
einer Dauer von mehr als drei Stunden folgen Momente unterschiedlicher 
Dichte einander ohne spürbares Ziel. Das Grundkonzept, den Kontrast 
zwischen den männlich herben Testpiloten und den geleckten Astronau- 
ten, hat man schnell begriffen. Danach passiert nicht mehr viel. Anders als 
in RAGING BULL, in dem die Stilisierung konsequent mit der Perspektive 
des Protagonisten verknüpft ist, wirken die formalen Experimente losge- 
löst von der erzählerischen Substanzwieverstreute Puzzleteile ohne Sinn 
und Zweck. So empfindet man THE RIGHT STUFF als Ganzes ermüdend 
und langatmig. 

Entsprechend disparat erscheint das Sound Design. Obwohl kunstvoll 
und mit viel Fantasie ausgestaltet, fehlt es insgesamt an kohärenter Struk- 
turbildung. Die vielen akustischen Einfälle sind alle in sich beeindruckend, 
aber sie bilden kein Ganzes. Trotzdem oder vielleicht gerade deshalb lohnt 
es sich, die Tonspur genauer unter die Lupe zu nehmen. An vielen Stellen 
verlässt sie das sichere Terrain etablierter Strategien, erfindet ein eigenes 
Vokabular oder ordnet bekannte Elemente neu. Besonders zwei Aspekte 
verdienen Beachtung: die Interaktion zwischen Musik und Geräuschen 
und der Versuch, abstrakte Konzepte mit Klangobjekten auszudrücken. 
In diesem Szenenausschnitt sind beide Komponenten vorhanden, deshalb 
habe ich ihn ausgewählt. Die Auflösung der Grenzen zwischen Musik und 
Geräusch geht in diesem Beispiel so weit, dass es an manchen Orten völlig 
beliebig ist, wie man die einzelnen Klangobjekte einordnet; die wenigsten 
Klangobjekte haben eine eindeutige Quelle im Bild. 

Protagonist der Sequenz ist Chuck Yeager, der legendäre Testpilot. 
Er gewinnt im Lauf des Films mehr und mehr die Konturen eines Helden 
und Märtyrers. Bereits zu Beginn des Films etabliert eine Voiceover-Erzäh- 
lung den mythischen Approach zu dieser Figur und ihrem Umfeld: 


Ein Dämon lebte in der Luft. Man sagte, wer diesen Dämon herausfordere, 
würde sterben, seine Kontrollinstrumente würden einfrieren, sein Flugzeug 
würde von wilden Böen geschüttelt und schließlich auseinander bersten. Der 
Dämon lebte bei Mach 1 auf der Anzeige, bei 750 Meilen pro Stunde, wo die 
Luft nicht mehr ausweichen kann. Er lebte hinter einer Mauer, von der man 
erzählte, dass niemand sie je durchbrechen könne. Man nannte sie die Schall- 
mauer. Dann bauten sie ein kleines Flugzeug, die X-1, um die Schallmauer zu 
durchbrechen. Und Männer kamen in die Wüste von Kalifornien, um es zu 
fliegen. Sie wurden Testpiloten genannt, und niemand kannte ihre Namen.' 


1 «There was a demon that lived in the air. They said whoever challenged him would 
die. Their controls would freeze up. Their planes would buffet wildly, and they would 
disintegrate. The demon lived at mach one on the meter, 750 miles an hour where the 
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Weitere wichtige Bestandteile der mythischen Dimension von Yeagers 
Persona bilden der Schauplatz - die kalifornische Steppe - sein Pferd und 
seine Frau. Der Kontext greift auf die etablierten Konnotationen des Wes- 
terns zurück, um Yeagers männlich-heldenhafte Aura zu etablieren. Ein- 
ziger Störfaktor im klassischen Westernbild ist die Frau. Yeager ist nicht 
der prototypische lonesome hero, sondern hat eine autonome, lebenslustige 
Partnerin, die ihm nicht nur auf dem Pferderücken ebenbürtig zu sein 
scheint. Dieser Frauentypus hat die Funktion, das bereits beschriebene 
Wertungsgefälle zwischen Yeager und den Astronauten zu untermauern. 
Die Frauen der Astronauten werden als dümmliche Püppchen dargestellt, 
deren größter Traum es ist, eines Tages im pastellfarbenen Chanel-Kostüm 
mit Jackie Kennedy zu dinieren. 

Nun also zum Szenenausschnitt: Yeager reitet bei Sonnenuntergang 
durch die Steppe und begegnet dort dem neuen Jet, der in der Voiceover 
als X-1 vorgestellt wurde, einem orangefarbenen kleinen Monster, Feuer 
speiend wie ein Drache. Gegenstand der zu analysierenden Ton-Bild-Mon- 
tage und ihres Sound Design ist das abstrakte Konstrukt Faszination. 


Die klanglichen Aspekte 
Die dynamische Entwicklung der Szene 


Wie in THE SILENCE OF THE LAMBS liegt auch für diese Sequenz keine auf- 
wendige Messung vor, sondern nur ein Ausschnitt: der Pegelverlauf bei 
400 Hz (Abb. 63, — 221). 

Deutlich sichtbar ist die Höhepunktstruktur, die sich jedoch anders 
als bei JurAssıc PARK nicht in einer kontinuierlichen Pegelzunahme auf 
ein antizipiertes Finale gestaltet, sondern eher als eine doppelte Steige- 
rung mit zwei Hochplateaus. Die Pegelmaxima setzen bei Einstellung 
2, PoV Yeager, auf die Flammen werfende Düse ein und erstrecken sich 
dann über die erste Annäherung Yeager-Jet bis zu dem Zeitpunkt in Ein- 
stellung 10, wo die Kamera in die Totale zurückspringt, um den Blick auf 
die gesamte Situation freizugeben. Die einzelnen Steigerungen, die den 
Bildeinstellungen auf Yeager entsprechen, sind deutlich als Pegelspit- 
zen sichtbar. Die langsame Pegelzunahme entspricht der Verengung auf 
der Bildseite. Die Totale in Einstellung 10 markiert eine deutliche Zäsur 
zwischen 0.00.34 und 0.00.38. Danach folgt ein zweites Hochplateau, das 


air can no longer move out of the way. He lived behind a barrier, through which they 
said no man could ever pass. They called it the sound barrier. Then they built a small 
plane, the X-1, to try to break the sound barrier. And men came to the high desert of 
California to ride it. They were called test pilots and no one knew their names.» 
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der physischen Begegnung Yeager - Jetinden Einstellungen 11 und 12 
entspricht. 

Dieses Bild trifft jedoch nur fiir einen mittleren Frequenzbereich um 
1000 Hz zu. In den Bässen ist die Pegelzunahme weit weniger deutlich. 
Vor allem fehlt dort eine Zäsur in der Totalen (10), das heift, die bildliche 
Distanz wird im Bassbereich - jenem Bereich, den man nur unterschwellig 
wahrnimmt - dissimuliert. Oder anders ausgedrückt: Zwischen der dyna- 
mischen Entwicklung der mittleren Frequenzen, die sich der bewussten 
Wahrnehmung zuerst erschließen, und der dynamischen Entwicklung des 
Bassbereichs, der kaum kognitiv entschlüsselt wird, besteht hinsichtlich 
ihres Zusammenhangs mit der narrativen Konstruktion und der Bildge- 
staltung ein deutlicher Unterschied. Indem die Bässe über die ganze Szene 
hinweg Kohärenz schaffen, werden sie zum umschließenden Gefäß für 
das Konstrukt Faszination. 


Frequenzverteilung (Abb. 64, — 222) 


Die bassigen Klangobjekte entwickeln sich aus einem brummenden Syn- 
thesizersound heraus, der bereits während des Heranreitens einsetzt und 
sich beim Stillstand fast unmerklich nach unten moduliert. Das Bassregis- 
ter umfasst weiter die Klangobjekte Schlagen doppelt dumpf (metallisch), 
deren Klang an Donnerbleche erinnert, die zusätzlich verhallt werden. Der 
metallische Aspekt des Klangs ist eher undeutlich und tritt erst mit der 
Verlagerung in den mittleren Bereich stärker in den Vordergrund. Unter- 
gründig dauert ein undefinierbares Grollen an, das wahrscheinlich dem 
Synthesizer zuzuschreiben ist. Eindeutig identifizierbar im Bassbereich ist 
nur das Schnauben des Pferdes. 

Bassbetont ist auch der Klang des Feuers, der fast ausschließlich aus 
einem dumpfen Flackern besteht. Bevor seine Quelle, die lodernde Düse, 
sichtbar ist, wird er langsam eingeblendet und schleicht sich damit sozu- 
sagen ins Klangbild ein. Rund um die Einstellungen 11 und 12 beherrscht 
dieses Klangobjekt die auditive Wahrnehmung mit Maximalpegeln. 

Im mittleren Bereich sind Teile des Feuers angesiedelt sowie das mar- 
kant-stakkatohafte Schlagen mittig metallisch regelmäßig und der Jet hochlau- 
fend, der sich organisch an das Wiehern des Pferdes anschließt (Abb. 63). 

Obwohl pegelmäßig eher bescheiden bestückt, trifft das Sirren hoch- 
undefiniert, das ich wegen seiner synthetischen Klanglichkeit der Musik 
zugeordnet habe, die empfindlichste Stelle des Hörbereichs (> iso- 
phonische Hörkurven 200) und erzeugt eine angespannte Grundstim- 
mung, die über kleine klangliche Modifikationen ständig neu genährt 
wird. 
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Isotopien 


Die Sequenz besteht ausschließlich aus Isotopien. Alle Klangobjekte sind 
in Serie geschaltet. Anders ausgedrückt: Die Tonkomposition ist nur 
Struktur. Die Klangobjekte sind kaum identifizierbar; außer den Geräu- 
schen des Pferdes und des Feuers haben sie keinen konkreten Ort im 
Bild. In einer schwebenden Zone zwischen abstrakt und konkret ist das 
Klangobjekt Jet hochlaufend anzusiedeln, das zwar eindeutig identifizier- 
bar ist, aber nicht vom Jet im Bild stammen kann, dessen Motor sich sicht- 
lich nicht bewegt. Der Jet wird vielmehr gerade vollgetankt, was mir als 
unbedarfter Zuschauerin angesichts der lodernden Flamme unplausibel 
erscheint. 

Der abstrakt-musikalische Charakter fast sämtlicher Klangobjekte 
erschwert die sprachliche Beschreibung. Die Variationen sind so unauf- 
fällig und schillernd, dass sie nur schwer fassbar sind. Über die Grenzen 
zwischen Musik und Geräusch kann man sich am Beispiel dieser Szene 
stundenlang unterhalten, ohne allgemein verbindliche Regeln zu finden. 

Jene Klangobjekte, die vom Synthesizer stammen, sind nur mini- 
mal strukturiert. Selbst das Bläsermotiv, das am ehesten einem etablier- 
ten Musikverständnis entspricht, bewegt sich mit seiner minimalistischen 
Dreitonstruktur am untersten Limit dessen, was man traditionell als musi- 
kalische Komposition begreift. 

Der wesentliche Kernpunkt der strukturellen Anlage ist ein Mor- 
phing bei 0.00.25, am Übergang zwischen Einstellung 7 und Einstellung 8, 
welches das Wiehern des Pferdes nahtlos an das Geräusch Jet hochlaufend 
angleicht (Abb. 65 und 66). 

Dieses Morphing verwebt zwei semantisch motivierte Isotopien: die 
Pferde- und die Jet-Schiene, zwischen denen damit ein metaphorischer 
Bedeutungsaustausch stattfindet. Der Pferdesound haucht sozusagen 
dem Jet Leben ein. Die Interpretation des Jets als kleiner Feuer speiender 
Drache dürfte im Wesentlichen über diesen Austausch entstehen, der kurz 
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darauf auch bildlich gefestigt wird. In den Einstellungen 1lund 12 wer- 
den das Pferd und das lodernde Feuer des Jets miteinander in einer dich- 
ten Bildkomposition verschmolzen (Abb. 67). Bild und Ton unterstützen 
einander in idealer Weise, ohne auf explizite Erklärungen zurückgreifen 
zu müssen. In der ganzen Begegnung fällt kein Wort. Die Szenerie ist men- 
schenleer. 

Die Montage verschiedener unidentifizierbarer Klangobjekte erzeugt 
den Eindruck von überbordender Reichhaltigkeit, indem sie wie eine 
musikalische Komposition zur nicht referenziellen Projektionsfläche für 
eigene Gefühle und Gedanken werden (Das unidentifizierbare Klangobjekt 
— 126). Darüber hinaus bringen Pferd und Feuer je eigene mythische Qua- 
litäten — das heißt auch Bedeutungen höherer Ordnung - in die komposi- 
torische Anlage ein. 

Die Sequenz entfernt sich in beispielhafter Weise von ängstlichen 
Plausibilitätsüberlegungen. Außer der Grundkonstellation — ein Testpi- 
lot reitet auf einem Pferd an einem Flugplatz vorbei - ist zumindest auf 
der Tonspur nicht seinem realitätsnahen Plausibilitätsbegriff verpflichtet. 
Alles ist reine Komposition einer überraschend begrenzten Anzahl abs- 
trakt-klanglicher Elemente einerseits und mythisch besetzter Klangobjekte 
andererseits, die über Isotopien, rhythmisierte Wiederholungen und eine 
ausgeklügelte dynamische Struktur ein dichtes polyfones Geflecht entwi- 
ckeln. 
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Tabelle THE RIGHT STUFF 


# | Zeit 


Bild 


Gerausche 


Musik 


1 | 0.00.00- 
0.00.03 


Yeager auf Pferd, 
halbnah 


Pferd schnaubend 
bassig 

Pferd wiehernd an- 
gedeutet 


Synthesizer bassig 
liegend 

Sirren hoch undefi- 
niert 


2 | 0.00.03- 
0.00.05 


PoV Yeager: Jet total 


Schlagen doppelt 
dumpf metallisch 


Sirren hoch undefi- 
iert anschwellend 


I 


3 | 0.00.05- 
0.00.11 


Yeager auf Pferd, nah 


Schlagen doppelt 
dumpf metallisch 
Pferd wiehernd an- 
gedeutet 


irren hoch modifi- 
ziert anschwellend 


WN 


4 | 0.00.11- 
0.00.13 


PoV Yeager: Jet näher 


Schlagen doppelt 
dumpf metallisch 


Sirren hoch undefi- 
niert, aber modifiziert 
anschwellend 


5 | 0.00.13- 
0.00.18 


Yeager auf Pferd, 
groB 


Pferd schnaubend 
bassig 

Pferd wiehernd an- 
gedeutet 

Schlagen doppelt 
dumpf metallisch 
Grummeln bassig an- 
schwellend 


Sirren hoch undefi- 
niert verhalten 


6 | 0.00.18- 
0.00.20 


PoV Yeager: Jet Detail 
Düse 


Grummeln bassig an- 
schwellend 

Feuer dumpf fla- 
ckernd 

Schlagen doppelt 
dumpf metallisch 
zweimal, lauter 


Sirren hoch undefi- 
niert, aber modifiziert 
anschwellend 


7 | 0.00.20- 
0.00.25 


Yeager auf Pferd, 
extrem groß 


Pferd schnaubend 
bassig 

Pferd wiehernd lauter 
Schlagen doppelt 
dumpf metallisch 
zweimal 


Sirren nur sehr leise 


8 | 0.00.25- 
0.00.27 


PoV Yeager: Jet nah 
von vorne 


Schlagen mittig me- 
tallisch regelmaBig 
Jet hochlaufend 
Schlagen dumpf me- 
tallisch entfernter 
Feuer dumpf fla- 
ckernd 
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# | Zeit Bild Geräusche Musik 
9 |0.00.27- | Yeager auf Pferd, 
0.00.34 | extrem groß 
10 | 0.00.34- | Totale Establishing 
0.00.38 | Shot Flugplatz mit 
Yeager auf Pferd und 
Jet 
11 | 0.00.38- | Schwenk mit Yeager | Feuer dumpf fla- Bläser synthetisch 
0.00.50 | auf Pferd total Yeager | ckernd anschwellend | Dreitonmotiv 
auf Pferd bei Jet bis Maximalpegel Sirren hochlaufend 
Pferd wiehernd und und anschwellend 
schnaubend ange- 
deutet 
Schlagen dumpf 
metallisch entfernter 
mehrmals 
12 | 0.00.50- | Schwenk Detail Jet 
0.01.01 | Düse mit Yeager im 
Hintergrund, Yeager 
reitet um Jet, halbnah 
13 | 0.01.01- | Totale Establishing Schlagen dumpf Sirren abklingend 
0.01.15 | Shot Flugplatz mit metallisch entfernter 
Yeager auf Pferd und | mehrmals, abklingend 
Jet, Yeager reitet Feuer dumpf fla- 
davon ckernd abklingend 
Pferd wiehernd an- 
gedeutet entfernt 
14 | 0.01.15- | Totale Landschaft, Pferdegetrappel ent- | Country-Musik diege- 
0.01.27 | Yeager reitet fort fernt sich tisch entfernt 
gegen Horizont Hintergrundrauschen 
leise 
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001 
ooz 
00€ 
00r 
009 
009 


The Big House 
ine Stadt sucht einen Mörder 


Kuhle Wampe 
Vampyr 


King Kong 
San Francisco 


Modern Times 


The Hurricane 
The Cowboy and the Lady 
itizen Kane 
Lady Hamilton 
This Land is Mine 
Wilson 
e Bishop's Wife 
e Snake Pit 
Twelve O’Clock High 
About Eve 
The Great Caruso 
The Sound Barrier 
From Here to Eternity 
e Glenn Miller Story 
Ben Hur 
The Alamo 
How the West Was Won 
Lawrence of Arabia 
s a Mad, Mad, Mad, Mad World 
The Great Race 
rand Prix 
In the Heat of the Night 
The Dirty Dozen 


Patton 
iddler on the Roof 
e Exorcist 
Jaws 
All the President's Men 
Earthquake 
ar Wars 
The Deer Hunter 
Apocalypse Now 
he Black Stallion 


Oliver! 


The Empire Strikes Back 


Raiders of the Lost Ark 
Raging Bull 


48 HRS 
E.T 


Das BOO 


The Right Stuff 
Rumble FISI 


Amadeus 
Out of Africa 
Back to the Future 
e Name of the Rose 
Platoon 


Aliens — The Return 


aravaggio 
The Last Emperor 


002 


Robocop 


Bird 


he Last Crusade 
Who Framed Roger Rabbit ? 
Ol 


The Hunt for Red Octobe 

Dances with Wolves 
Delicatessen 
Silence of the Lambs 
Terminator 2 
Malcolm X 
elma & Louise 
Orlando 
e Player 


Jurassic Park 


e Piano 


peed 
Apollo 13 


008 
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Blackmai 
The Big House 
M - Eine Stadt sucht einen Mörder 
Kuhle Wampe 
Vampyr 
King Kong 
San Francisco 


e Hurricane 
The Cowboy and the Lady 
Citizen Kane 
ady Hamilton 
is Land is Mine 
Wilson 
The Bishop's Wife 
The Snake Pit 
Twelve O'Clock High 
All About Eve 
The Great Caruso 
The Sound Barrier 
rom Here to Eternity 
e Glenn Miller Sto 
Ben Hur 
e Alamo 
How the West Was Won 
Lawrence of Arabia 


Modern Times 


It's a Mad, Mad, Mad, Mad World 


e Great Race 
rand Prix 
In the Heat of the Night 
e Dirty Dozen 
Oliver! 


on 
Fiddler on the Roof 
The Exorcist 


pa 


Earthquake 


Jaws 


e Presidents Men 


e Deer Hunter 
Apocalypse Now 
e Black Stallion 


Raiders of the Los 


Star Wars 


The Empire Strikes Back 


AT 
Raging Bull 


Das Boot 


The Right Stuff 
Rumble Fish 
Amadeus 


Back to the Future 
e Name of the Rose 
Platoon 


Aliens — The Return 


aravaggio 
The Last Emperor 
Robocop 


Who Framed Roger Rabbit ? 


Bird 
Ol 


Dances with Wolves 


The Hunt for Red October 


Delicatessen 


ilence of the Lambs 
erminator 
elma & Louise 
Orlando 
The Player 
urassic Park 
e Piano 


Malcolm X 
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Blackmail 
The Big House 
M — Eine Stadt sucht einen Mörder 
Kuhle Wampe 
Vampyr 
King Kong 
Modern Times 
Modern Times 
e Hurricane 
e Cowboy and the Lady 
Citizen Kane 
Lady Hamilton 
This Land is Mine 
Wilson 
e Bishop's Wife 
The Snake Pit 
welve O Clock High 
All About Eve 
The Great Caruso 
e Sound Barrier 
From Here to Eternity 
The Glenn Miller Story 
Ben Hur 
The Alamo 
How the West Was Won 
awrence of Arabia 
It's a Mad, Mad, Mad, Mad World 
e Great Race 
Grand Prix 
In the Heat of the Night 
e Dirty Dozen 
Oliver! 
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Fiddler on the Roof 


The Exorcist 
arthquake 
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All the President's Men 


‘ar Wars 
The Deer Hunter 
Apoca ypse low 
The Black Stallion 
e Empire Strikes Back 
Raiders of the Lost Ark 
Raging Bull 


48 HRS 


Das BOO 


e Right Stuff 
Rumble Fish 
Amadeus 
Out of Africa 
Back to the Future 
The Name of the Rose 
Platoon 
Aliens — The Return 
Caravaggio 
e Last Emperor 
Robocop 


Bird 
Who Framed Roger Rabbit ? 
The Hunt for Red October 


O| 


Dances with Wolves 
Delicatessen 
Silence of the Lambs 
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BLACKMAIL 
(GB 1929, Alfred Hitchcock) 


THE Bic HOUSE 
(USA 1930, George Hill) 
Bester Ton 1930 


M - EINE STADT SUCHT EINEN MORDER 
(Deutschland 1931, Fritz Lang) 


KUHLE WAMPE 
(Deutschland 1932, Slatan Dudow) 


VAMPYR 
(Deutschland 1932, Carl Theodor Dreyer) 


A FAREWELL TO ARMS 
(USA 1932, Frank Borzage) 
Bester Ton 1933 


Kinc Kong 
(USA 1933, Merian C. Cooper / Ernest B. 
Schoedsack) 


ONE NIGHT OF LOVE 
(USA 1934, Victor Schertzinger) 
Bester Ton 1935 


NAUGHTY MARIETTA 
(USA 1935, W.S. Van Dyke) 
Bester Ton 1935 


SAN FRANCISCO 
(USA 1936, W.S. Van Dyke) 
Bester Ton 1936 


MODERN TIMES 
(USA 1936, Charles Chaplin) 


THE HURRICANE 
(USA 1937, John Ford) 
Bester Ton 1937 


THE COWBOY AND THE LADY 
(USA 1938, H.C. Potter) 
Bester Ton 1938 


WHEN TOMORROW COMES 
(USA 1939, John M. Stahl) 
Bester Ton 1939 


STRIKE UP THE BAND 
(USA 1940, Busby Berkeley) 
Bester Ton 1940 


CITIZEN KANE 
(USA 1941, Orson Welles) 
Nomination Ton 1941 


LADY HAMILTON 
(GB 1941, Alexander Korda) 
Bester Ton 1941 


YANKEE DOODLE DANDY 
(USA 1942, Michael Curtiz) 
Bester Ton 1942 


THIS LAND IS MINE 
(USA 1943, Jean Renoir) 
Bester Ton 1943 


WILSON 
(USA 1944, Henry King) 
Bester Ton 1944 


THE BELLS OF ST. MARY’S 
(USA 1945, Leo McCarey) 
Bester Ton 1945 


THE JOLSON STORY 
(USA 1946, Alfred E. Green) 
Bester Ton 1946 


THE BisHop’s WIFE 
(USA 1947, Henry Koster) 
Bester Ton 1947 
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THE SNAKE PIT 
(USA 1948, Anatole Litvak) 
Bester Ton 1948 


TWELVE O’CLocK HIGH 
(USA 1949, Henry King) 
Bester Ton 1949 


ALL ABOUT EVE 
(USA 1950, Joseph L. Mankiewicz) 
Bester Ton 1950 


THE GREAT CARUSO 
(USA 1951, Richard Thorpe) 
Bester Ton 1951 


THE SOUND BARRIER 
(GB 1952, David Lean) 
Bester Ton 1953 


FROM HERE TO ETERNITY 
(USA 1953, Fred Zinnemann) 
Bester Ton 1953 


THE GLENN MILLER STORY 
(USA 1954, Anthony Mann) 
Bester Ton 1955 


OKLAHOMA! 
(USA 1955, Fred Zinnemann) 
Bester Ton 1955 


THE KING AND I 
(USA 1956, Walter Lang) 
Bester Ton 1957 


SAYONARA 
(USA 1957, Joshua Logan) 
Bester Ton 1957 


SOUTH PACIFIC 
(USA 1958, Joshua Logan) 
Bester Ton 1958 


BEN-HUR 
(USA 1959, William Wyler) 
Bester Ton 1959 


THE ALAMO 
(USA 1960, John Wayne) 
Bester Ton 1960 


PsycHo 
(USA 1960, Alfred Hitchcock) 


WEST SIDE STORY 
(USA 1960, Robert Wise / Jerome Robbins) 
Bester Ton 1961 


How THE West Was Won 

(USA 1961, Henry Hathaway / George Mar- 
shall / John Ford) 

Bester Ton 1963 


LAWRENCE OF ARABIA 
(GB/USA 1962, David Lean) 
Bester Ton 1962 


It’s A Map, MAD, MAD, MAD WORLD 
(USA 1962, Stanley Kramer) 
Beste Toneffekte 1964 


THE BIRDS 
(USA 1963, Alfred Hitchcock) 


My Farr LADY 
(USA 1963, George Cukor) 
Bester Ton 1964 


THE SOUND OF Music 
(USA 1964, Robert Wise) 
Bester Ton 1965 


THE GREAT RACE 
(USA 1964, Blake Edwards) 
Beste Toneffekte 1965 


GRAND PRIX 
(USA 1966, John Frankenheimer) 
Beste Toneffekte 1966, Bester Ton 1966 


IN THE HEAT OF THE NIGHT 
(USA 1966, Norman Jewison) 
Bester Ton 1967 


THE DIRTY DOZEN 
(USA 1967, Robert Aldrich) 
Beste Toneffekte 1968 


OLIVER! 
(GB 1967, Carol Reed) 
Bester Ton 1968 
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HELLO, DoLty! 
(USA 1968, Gene Kelly) 
Bester Ton 1969 


PATTON 
(USA 1969, Franklin J. Schaffner) 
Bester Ton 1970 


FIDDLER ON THE ROOF 
(USA 1971, Norman Jewison) 
Bester Ton 1971 


CABARET 
(USA 1972, Bob Fosse) 
Bester Ton 1972 


THE ExORCIST 
(USA 1973, William Friedkin) 
Bester Ton 1973 


EARTHQUAKE 
(USA 1974, Mark Robson) 
Bester Ton 1974 


Jaws 
(USA 1975, Steven Spielberg) 
Bester Ton 1975 


THE HINDENBURG 
(USA 1975, Robert Wise) 
Beste Toneffekte 1976 


ALL THE PRESIDENT’S MEN 
(USA 1976, Alan J. Pakula) 
Bester Ton 1976 


CLOSE ENCOUNTERS OF THE THIRD KIND 
(USA 1977, Steven Spielberg) 
Bester Tonschnitt 1977 


STAR WARS 
(USA 1977, George Lucas) 
Bester Ton 1977, Beste Toneffekte 1978 


THE DEER HUNTER 
(USA 1978, Michael Cimino) 
Bester Ton 1978 


APOCALYPSE Now 
(USA 1979, Francis Ford Coppola) 
Bester Ton 1979 


THE BLACK STALLION 
(USA 1979, Carroll Ballard) 
Beste Toneffekte 1980 


THE EMPIRE STRIKES BACK 
(USA 1979, Irvin Kershner / George Lucas) 
Bester Ton 1980 


RAGING BULL 
(USA 1980, Martin Scorsese) 


RAIDERS OF THE Lost ARK 
(USA 1981, Steven Spielberg) 
Bester Ton 1981, Bester Tonschnitt 1981 


Das Boot 
(Deutschland 1981, Wolfgang Petersen) 
Nomination Ton 1982 


48 Hrs. 
(USA 1982, Walter Hill) 


E.T. — THE EXTRATERRESTRIAL 
(USA 1982, Steven Spielberg) 
Bester Ton 1982, Bester Tonschnitt 1982 


THE RIGHT STUFF 
(USA 1983, Philip Kaufman) 
Bester Ton 1983, Bester Tonschnitt 1983 


RuMBLE FIsH 
(USA 1983, Francis Ford Coppola) 


AMADEUS 
(USA 1984, Milos Forman) 
Bester Ton 1984 


OUT OF AFRICA 
(USA 1985, Sydney Pollack) 
Bester Ton 1985 


BACK TO THE FUTURE 

(USA 1985, Robert Zemeckis) 
Bester Tonschnitt 1985, 
Nomination Ton 1985 


THE NAME OF THE ROSE 
(Frankreich/Italien/BRD 1985, Jean-Jacques 
Annaud) 
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PLATOON 
(USA 1986, Oliver Stone) 
Bester Ton 1986 


ALIENS — THE RETURN 
(USA 1986, James Cameron) 
Bester Tonschnitt 1986, 
Nomination Ton 1986 


CARAVAGGIO 
(GB 1986, Derek Jarman) 


THE LAST EMPEROR 
(USA 1987, Bernardo Bertolucci) 
Bester Ton 1987 


RoBocoP 
(USA 1987, Paul Verhoeven) 
Bester Tonschnitt 1988 


BIRD 
(USA 1987, Clint Eastwood) 
Bester Ton 1988 


INDIANA JONES AND THE LAST CRUSADE 


(USA 1988, Steven Spielberg) 


Beste Toneffekte 1989, Nomination Ton 1989 


WHO FRAMED ROGER RABBIT? 
(USA 1988, Robert Zemeckis) 
Beste Toneffekte 1988, 
Nomination Ton 1988 


GLORY 
(USA 1989, Edward Zwick) 
Bester Ton 1989 


THE HUNT FOR RED OCTOBER 
(USA 1990, John McTiernan) 
Bester Tonschnitt 1990, 
Nomination Ton 1990 


Dances WITH WOLVES 
(USA 1990, Kevin Costner) 
Bester Ton 1990 


DELICATESSEN 


(Frankreich 1990, Jean-Pierre Jeunet / Marc Caro) 


THE SILENCE OF THE LAMBS 
(USA 1990, Jonathan Demme) 
Nomination Ton 1991 


TERMINATOR 2 
(USA 1991, James Cameron) 
Beste Toneffekte 1991 


MALCOLM X 
(USA 1991, Spike Lee) 


THELMA & LOUISE 
(USA 1991, Ridley Scott) 


ORLANDO 
(GB 1992, Sally Potter) 


THE PLAYER 
(USA 1992, Robert Altman) 


Jurassic Park 
(USA 1993, Steven Spielberg) 
Beste Toneffekte 1993, Bester Ton 1993 


THE PIANO 
(Neuseeland 1993, Jane Campion) 


SPEED 
(USA 1994, Jan de Bont) 
Bester Ton 1994 


APOLLO 13 
(USA 1995, Ron Howard) 
Bester Ton 1995 


STAR Wars EPISODE I 
(USA 1999, George Lucas) 


WILD WILD WEST 
(USA 1999, Barry Sonnenfeld) 
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Glossar 


ADR (Automated Dialogue Replacement) 
Bezeichnet die computergesttitzte Nach- 
synchronisation von Dialogpassagen 
im Studio 


Affordance 

Begriff von Gibson (1979); er versteht 
darunter die Relation zwischen einem 
Umweltangebot und einem Lebewesen 


Akzent 

Hervorheben eines Klangobjekts aus 
seinem Umfeld durch Lautstärke oder 
andere akustische Parameter wie Ton- 
höhe oder Klangfarbe 


akzidentielle Merkmale 
— fakultative Merkmale, Gegensatz 
— obligatorische Merkmale 


Amboss 
Gehörknöchelchen im Innenohr 


amorph 
Ohne definierte Form 


Amplitude 
Maximale Auslenkung einer Sinuswelle 


analog 
Zeit- und amplitudenkontinuierliche 
Darstellung eines Signals 


Apparatus-Theorie 

Filmtheorie, die sich mit der Auswir- 
kung des technischen Apparats auf die 
Filmrezeption befasst, z.B. der Anord- 
nung von Projektion, Publikum und 
Leinwand im Kino 


Arbeitsprinzip eines Mikrofons 

Art und Weise, wie die Schwingungen 
einer Mikrofonmembran in elektrische 
Signale umgewandelt werden (Kon- 
densatormikrofone, dynamische Mi- 
krofone) 


arbiträr 
willkürlich 


Artefakt 
Kunstprodukt 


Atmosphäre 

Organisation mehrerer Klangobjekte 
zu Verbünden, die einen bestimmten 
Schauplatz charakterisieren 


Auflösung 

Feinheit und Präzision im Erfassen von 
klanglichen Details einer technischen 
Aufzeichnungs- und Wiedergabeappa- 
ratur 


Ausklingvorgang 

Der letzte Zeitabschnitt eines Klangob- 
jekts nach dem Ende der maximalen In- 
tensität bis zur völligen Ruhe 

(> Hüllkurve) 


Aural Exciter 

Effektgerät, das mit gezielten Verzer- 
rungen im oberen Frequenzbereich den 
Eindruck von Brillanz und Transparenz 
bei der Klangaufzeichnung oder -wie- 
dergabe verstärkt 


Aurikularisierung 
Begriff von Gaudreault/Jost (1990) für 
auditive Subjektivierungen 
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AuBenohr 
Jener Teil des Ohrs, der außerhalb des Trom- 
melfells liegt (Ohrmuschel, Gehörgang) 


Bandchenmikrofon 

Dynamisches Mikrofon, bei dem der 
Schalldruck ein lose aufgehängtes 
Bandchen in Schwingung versetzt, das 
sich im Feld eines starken Permanent- 
magneten befindet 


Bandmaschine 
Tonaufzeichnungsgerät mit Magnet- 
band als Speichermedium 


Basse 
Frequenzen zwischen ca. 20 bis 125 Hz 


Behaviorismus, behavioristisch 
Psychologische Schule, die einen direk- 
ten Zusammenhang zwischen Reiz und 
Reaktion annimmt 


Beugung 

Wellentheoretisches Phänomen, bei 
dem Schall an einer Hinderniskante 
von der geraden Ausbreitungsrichtung 
abgelenkt wird 


Bit (Binary Digit) 
Die kleinste Einheit mit dem Wert 0 
oder 1 eines digitalen Codes 


Bottom-up 

In der Aufmerksamkeitstheorie ein Pro- 
zess, bei dem die unwillkürliche Auf- 
merksamkeit von äußeren, peripheren 
Ereignissen ausgelöst wird 


Branding 
Verknüpfung einer Warenmarke mit 
einem bestimmten Image 


breitbandig 
Akustisches Ereignis, das einen großen 
Frequenzbereich umfasst 


Breitwandformat 
Filmbildformate mit den Seitenverhält- 
nissen 1,66:1 bis 2,68:1 


Chunk, Chunking 

Zusammenfassung von mehreren In- 
formationseinheiten unter einem ge- 
meinsamen Aspekt; dient der Kapazi- 
tätsentlastung der menschlichen Infor- 
mationsverarbeitung 


Cinéma copain 

Drehen mit einem Team, das sich aus 
Freunden und Bekannten zusammen- 
setzt, die fiir eine minimale Gage arbeiten 


CinemaScope (Ton) 
Breitwandformat mit vier magneti- 
schen Randspuren (rechts, Mitte, links 
plus Effektkanal) 


Cochlea 
Gehörschnecke im Innenohr 


Cocktailparty-Effekt 

Beschreibt die Fahigkeit des menschli- 
chen Gehörs, in einer komplexen akus- 
tischen Umgebung die auditive Auf- 
merksamkeit auf bestimmte akustische 
Ereignisse, beispielsweise ein Gesprach, 
zu fokussieren 


Codeswitching 

Fahigkeit eines Sprechers, je nach Situ- 
ation verschiedene Sprachebenen, z.B. 
Umgangs- oder Fachsprache, anzuwen- 
den 


ComMag 

Eine magnetische Beschichtung zur 
Tonaufzeichnung, die direkt auf den 
Rand des Bildträgers aufgetragen wird 


deklaratives Wissen 
Jene Teile des Wissens, die man sprach- 
lich fassen kann 


Dezibel (dB) 

Logarithmische Maßeinheit zur Bezeich- 
nung des Schalldrucks in Relation zu 
einem vorgegebenen Bezugsschalldruck 


diachronisch 
Über einen längeren Zeitraum verteilt 
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dichotisches Hören 
Hören zweier unterschiedlicher Signale 
über Kopfhörer 


Dichotomisierung 
Überbetonung von Unterschieden, Ver- 
stärkung von Kontrasten 


Diegese 
Das raumzeitliche Kontinuum des Spiel- 
films, in dem die Figuren leben und 
handeln 


diegetisch 
Aus der Diegese stammend 


diffuser Schall 

Jene Schallanteile, die in einem Raum 
aufgrund von Reflexionen an den Be- 
grenzungsflächen aus verschiedenen 
Richtungen auf das Ohr auftreffen und 
keine Richtungsinformation mehr ent- 
halten, Gegenteil — direkter Schall 


digital 
Als Zahlenfolge codiert 


Digital Audio Workstation 
Computereinheit zur Bearbeitung von 
Tonaufnahmen während der Postpro- 
duktion; mit Speicherung, Schnitt, Ver- 
änderung mit internen (> Plug-ins) 
oder externen Effektgeräten, häufig auf 
der Basis von > MIDI 


Digital Theater Sound (DTS) 

Digitales Kinotonformat, bei dem sich 
die Toninformation auf einer CD-ROM 
befindet, die von Synchronimpulsen 
auf dem Bildträger gesteuert wird 


direkter Schall 
Jene Schallanteile, die das Gehör auf di- 
rektem Weg erreichen 


diskret 
getrennt 


dissipatives System 
Ein System, das nur durch ständige 


Energiezufuhr aufrechterhalten wer- 
den kann 


Dissonanz 

Gleichzeitig erklingende akustische Er- 
eignisse, die als misstönend empfunden 
werden 


Dissoziation 
Auseinanderklaffen von auditiven und 
visuellen Wahrnehmungen 


Dopplereffekt 

Veränderung der wahrgenommenen 
Tonhöhe einer sich schnell bewegenden 
Schallquelle 


DVD (Digital Versatile Disc) 
Plattenförmiges digitales Speicherme- 
dium zur Aufzeichnung von Bild und/ 
oder Ton oder anderer Daten 


Dynamik 
In der Musiktheorie Verlauf der Laut- 
stärke 


dynamisches Mikrofon 
Wandelt Schallwellen durch Induktion, 
die von einem Magneten erzeugt wird, 
in ein elektrisches Signal 


Echo 
— Reflexionen mit einer zeitlichen 
— Verzögerung von mehr als 50 ms 


Effektkanal 

Zusatzkanal der magnetischen Mehr- 
spurformate, die in den 1950er-Jahren 
entwickelt wurden; der E. gab über einen 
Lautsprecher im hinteren Teil des Kinos 
Klangobjekte wieder; er wurde über ein 
Steuersignal bei Bedarf zugeschaltet 


efferent 

Absteigend; bezeichnet in der Neurolo- 
gie Nervenfasern, die Impulse vom Ge- 
hirn in die Peripherie (z.B. das Ohr) leiten 


Einschwingvorgang 
Zeitabschnitt, in dem sich der Klang 
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aus der Ruhe bis zu seinem endgültigen 
Zustand entwickelt (> Hüllkurve) 


Enunziationsmarkierung 

Begriff von Metz (1991) zur Beschrei- 
bung von Phänomenen, in denen «der 
Film» direkt zum Zuschauer spricht 
und die von der Erzählinstanz hin- 
zugefügt werden wie beispielsweise 
Schwarzblenden 


Establishing Shot 
Totale, die einen Schauplatz einführt 


Eustachische Röhre 
Verbindung zwischen Mittelohr und Ra- 
chenraum, dient dem Druckausgleich 


Extension 
Begriff von Chion (1990: 77) für die räum- 
liche Ausdehnung von Klangobjekten 


extradiegetisch 

Elemente, die von außerhalb der > Di- 
egese kommen, also von der Erzähl- 
instanz hinzugefügt werden, wie bei- 
spielsweise Musik 


fakultative Merkmale 

Charakterisieren spezifische Eigen- 
schaften eines bestimmten Objekts 
(> obligatorische Merkmale, > Token) 


Fantasound 

Mehrspurverfahren mit vier Spuren, 
die auf vier parallel laufende Filmton- 
träger kopiert wurden (drei Tonspuren 
und eine Steuerspur mit Tonimpulsen, 
welche die Verstärkung der verschiede- 
nen Spuren definierte), in den Disney- 
Studios für den Animationsfilm FANTA- 
sIA (USA 1940) entwickelt 


Federhall 
Hallgerät, in dem das akustische Signal 
eine Spiralfeder zum Schwingen bringt 


Feldstärke (magnetisch) 
Kraftwirkung eines magnetischen Fel- 
des [A/m] 


Filter 

Einheit zur Veränderung (Verstärkung 
oder Dämpfung) einzelner > Frequen- 
zen oder > Frequenzbänder 


Fokalisierung 

Begriff von Genette (1972, 1983) zur Be- 
zeichnung des Blickpunkts in einem li- 
terarischen Text; einige Aspekte einer 
potenziell vollständigen Information 
werden unterdrückt, andere im Hin- 
blick auf die subjektive Bedeutsamkeit 
einer Figur betont 


Foley Artist 
Amerikanische Bezeichnung für Geräu- 
schemacher, benannt nach Jack Foley 


Frequenz 
Anzahl der Schallschwingungen pro 
Sekunde [> Hz] 


Frequenzband 
Frequenzen innerhalb eines bestimm- 
ten Bereichs, z.B. von 20-100 Hz 


Frequenzdistribution, Frequenzver- 
teilung 

Die strukturelle Verteilung der Fre- 
quenzen in die Bereiche Bässe (20- 
125 Hz), Mitten (125-1.000 Hz), Präsen- 
zen (1-6 kHz) und Höhen (6-18 kHz) 


Frequenzgang 

Frequenzabhängiges Übertragungsver- 
halten von aktiven oder passiven Kom- 
ponenten der Tonaufzeichnung oder 
-wiedergabe (Mikrofone, Lautsprecher, 
Kabel) 


Frequenzmodulation 
Periodische Veränderungen der Fre- 
quenz 


Funkmikrofon 

Mikrofon, das an einen Sender ange- 
schlossen wird, der die Schallwellen 
per Funk an einen Empfänger über- 
trägt, der mit dem Aufnahmegerätver- 
bunden ist 
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Gate 
Elektrische Schaltung, die das Signal erst 
ab einer bestimmten Spannung tibertragt 


Generalisierung 

Uberbetonen von Gemeinsamkeiten, 
Auflösen von Kontrasten bei der Zeich- 
nung von Schauplatzen 


Genreswitching 

Import von Klangelementen aus einem 
anderen Genre, die sich deutlich vom 
Kontext unterscheiden, zur Markierung 
eines Umschwungs 


Gerauscharchiv 

Sammlung von Geräuschen (auf Ma- 
gnetband, Schallplatte oder CD) zur 
Vertonung von Filmen und Hörspielen 


Geräuschemacher 

Stellt die synchronen Geräusche des 
Films, zum Beispiel Schritte, im Stu- 
dio her 


Grundfrequenz, Grundton 

Tiefste Frequenz eines > harmonischen 
Klangs, verantwortlich für die Empfin- 
dung der Tonhöhe 


Haarzellen 

Behaarte Nervenzellen im Innenohr, die 
durch Auslenkung der Basilarmembran 
aktiviert werden 


Haas-Effekt 

Innerhalb eines Zeitraums von 50 ms be- 
dingt die erste auf das Ohr auftreffende 
Schallwelle die Ortung auch dann, wenn 
innerhalb dieses Zeitraums ein zweiter 
Schall von größerer Intensität aus einer 
anderen Richtung auf das Ohr trifft 


Hall 
Nachklingen in einem Raum nach Ver- 
stummen der Schallquelle 


Hallraum 
Leer stehender, schallisolierter und 
stark reflektierender Raum, in den das 


akustische Ereignis zur Zumischung 
von Hall über einen Lautsprecher zu- 
gespielt und von einem oder mehreren 
Mikrofonen wieder aufgenommen wird 


Hammer 

Gehörknöchelchen im Mittelohr zur 
Übertragung der Schwingungen vom 
Trommelfell auf das ovale Fenster 


handlungsgebundenes Geräusch 
Geräusch, das durch die Bewegungen 
der Filmfiguren ausgelöst wird, bei- 
spielsweise Schritte 


harmonisch 

Klang, der sich aus einem Grundton 
und einem oder mehreren Obertönen 
zusammensetzt, wobei die Frequenzen 
der Obertöne ganzzahlige Vielfache der 
— Grundfrequenz sind 


Harmonizer 

Elektroakustisches oder digitales Ef- 
fektgerät zur Veränderung der Tonhöhe 
einer Aufnahme ohne Beschleunigung 
oder Verlangsamung 


Hemisphäre 
Hirnhälfte 


Hertz (Hz) 
Maßeinheit zur Bezeichnung der Fre- 
quenz 


Hochfrequenz-Vormagnetisierung 
Überwindet in Magnetbandaufnahmen 
die starke Nichtlinearität bei kleinen 
Feldstärken und führt zu einer wesent- 
lich effizienteren Ausschöpfung der 
Magnetisierbarkeit 


Höhen 
Frequenzen von ca. 6.000 bis 20.000Hz 


homolog 
übereinstimmend 


Hörfeld 
Jener Bereich der auditiven Wahrneh- 
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mung, in welchem ein akustisches Er- 
eignis eine wahrnehmbare Empfindung 
auslöst 


Hörpunkt (point d’écoute) 
Bezeichnet in Analogie zum Begriff 
Blickpunkt den Ort, von dem aus gehört 
wird (Chion 1985) 


Hüllkurve 

Dynamische Entwicklung eines Klang- 
objekts entlang der Zeitachse, mit den 
Abschnitten > Einschwingvorgang, 
Körper und — Ausklingvorgang 


implizites Wissen 

Jenes Wissen, das sprachlich nicht oder 
nur schwer gefasst werden kann und 
hauptsächlich der Verhaltenssteuerung 
dient, Gegenteil > deklaratives Wissen 


inhibitorisch 
Hemmend in Bezug auf Nervenimpulse 


Innenohr 

Jener Teil des Ohrs, in dem die Schall- 
wellen in neuronale Impulse gewandelt 
werden 


Intensität 
— Schalldruckpegel 


interaurale Intensitätsdifferenz 
Pegelunterschied, mit dem ein seitlich 
positioniertes Klangobjekt auf die bei- 
den Trommelfelle auftrifft; er kommt 
dadurch zustande, dass am abgewand- 
ten Ohr, bedingt durch die Kopfform, 
ein Schallschatten entsteht 


interaurale Zeitdifferenz 

Zeitliche Differenz zwischen dem Auf- 
treffen der Schallwellen auf die beiden 
Ohren 


Interferenz-Richtmikrofon 

Mikrofon mit keulenförmiger Richtcha- 
rakteristik, bei dem die seitlich einfal- 
lenden Schallwellen aufgrund der Bau- 
form gedämpft werden 


intertextuell 

Auf andere Texte bezogen, in dem Teile 
dieser Texte zitiert, neu formuliert oder 
auch nur unterschwellig in Bruchstü- 
cken präsent sind 


Intonarumori 
Maschinen des Futuristen Russolo zur 
Herstellung von Geräuschen 


Invariante 
Unveränderliche Größe in der Mathe- 
matik 


isophonische Hörkurven 

Grafische Darstellung der frequenzab- 
hängigen Empfindlichkeit des mensch- 
lichen Ohrs 


Isotopie 

In Anschluss an Greimas (1966) Rei- 
hungen ähnlich gearteter Klangobjekte, 
welche die Kohärenz eines Lektüreab- 
laufs stützen, speziell die Organisation 
der Klangobjekte nach Gesichtspunk- 
ten der sensorischen Dimension 


Kanonisierung 
Unterwerfung eines Werks unter einen 
überlieferten Regelkatalog 


Katharsis 

Begriff von Aristoteles für die Reini- 
gung von inneren Spannungen durch 
intensive Gefühlserlebnisse beider Re- 
zeption von Kunstwerken 


Kausalitätsbeziehung 
Ursache-Wirkung-Beziehung 


Klang 

Bedeutet sowohl die > Klangfarbe als 
auch die harmonische Schallemission 
eines Objekts 


Klangfarbe 

Die wahrgenommene Färbung eines 
Klangs geht physikalisch gesehen auf 
Teilschwingungen oder Obertöne sowie 
Geräuschanteile zurück 
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Klangobjekt (objet sonore) 

Begriff von Pierre Schaeffer (1966: 23) 
zur Bezeichnung von akustischen Emis- 
sionen nicht sprachlicher Natur 


Klassem 

Merkmal, das die Zugehörigkeit eines 
Objekts zu einer Klasse definiert und es 
von einer anderen unterscheidet, z.Bsp. 
belebt-unbelebt 


kognitiv 
erkenntnismäßig 


Kondensatormikrofon 

Wandelt Schallwellen in ein elektri- 
sches Signal, indem eine metallbe- 
dampfte Membran, die zusammen mit 
einer Gegenelektrode einen Kondensa- 
tor bildet, in Schwingung versetzt wird 
und damit Kapazitätsveränderungen 
bewirkt; sehr empfindlich, mit hervor- 
ragenden Klangeigenschaften, haupt- 
sächlich im professionellen Bereich ver- 
wendet 


konnektionistisches Netz 

Muster von Verbindungen zwischen 
einergroßen Anzahl von Nervenzellen 
im Gehirn zur Speicherung und Ak- 
tualisierung von Gedächtnisinhalten 
(> plastische Konnektionen) 


Kontrapunkt 

Von Eisenstein et al. (1928) aus der Mu- 
siktheorie übernommener Begriff zur 
Bezeichnung der Kombination unter- 
schiedlicher Inhalte auf der Bild- und 
Tonebene 


Kortex 
Großhirnrinde 


kortikal 
Aus der Hirnrinde (Kortex) stammend 


Kunstkopfmikrofon 

Plastische Nachbildung eines mensch- 
lichen Kopfs, bei dem sich die Mikro- 
fonmembranen an der Stelle der Trom- 


melfelle befinden; bei Wiedergabe über 
Kopfhörer ist eine exakte Ortung der 
akustischen Ereignisse möglich 


Label 

Orientierungskriterien («Etiketten»), 
die überschaubare und damit auch im 
Gedächtnis speicherbare Kategorien 
schaffen 


latente Bedeutung 
Verborgene Bedeutung, die vom Rezi- 
pienten entschlüsselt werden muss 


Lateralisation 
— zerebrale Lateralisation 


Lautsphäre 
Akustische Umwelt 


Lautstärke 
Maß zur Beschreibung des subjektiven 
Empfindens der Intensität eines Schall- 
ereignisses 


Leitmotiv 
Begriff von Richard Wagner; wieder- 
kehrende Tonfolge, welche innerhalb 
eines Musikstücks Figuren, Ereignisse, 
Situationen, Gegenstände charakteri- 
sieren soll 


Lichtton 

Fotografische Aufzeichnung von Schall- 
wellen (> Sprossenschrift, > Zacken- 
schrift) 


Location Sound Mixer 

Amerikanisch für Filmtonmeister; ver- 
antwortlich für die Tonaufnahme wäh- 
rend der Dreharbeiten 


Longitudinalwellen 

Wellen mit identischer Ausbreitungs- 
und Schwingungsrichtung; die Mo- 
leküle bleiben im Mittel an Ort und 
schwingen um ihre Ruhelage herum; zu 
dieser Wellenform gehören die Schall- 
wellen 
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magnetische Schallspeicherung 
— Magnetton 


Magnetton 
Die Toninformation wird magnetisch 
gespeichert 


Mainstreamfilm 

Konventionelle Kinospielfilme, die 
nach kommerziellen Gesichtspunkten 
entwickelt werden und hauptsächlich 
der Unterhaltung dienen sollen 


Making of 

Als Marketinginstrument angelegter 
Dokumentarfilm über die Entstehung 
eines Kinospielfilms; mit technischen 
Informationen und Interviews 


manifeste Bedeutung 
Offensichtliche Bedeutung; Gegensatz 
— latente Bedeutung 


Matrix 

Elektrische Schaltung zur En- und De- 
codierung von Tonsignalen, reduziert 
zum Beispiel in Dolby Stereo 4 Kanäle 
auf 2 Spuren 


matriziert 
Durch eine Matrix encodiert 


Mehrspurtechnik 
Tonaufzeichnungsverfahren, bei dem 
mehrere Kanäle parallel auf einen Trä- 
ger (zum Beispiele in Magnetband) auf- 
gezeichnet werden 


Mehrwert 

Begriff von Chion (1990: 8) zur Bezeich- 
nung der Anreicherung des Bilds durch 
die Klangobjekte auf der Tonspur 


Mickey-Mousing 

Stellt (wie im Animationsfilm üblich) 
einen Kausalitätsbezug zwischen opti- 
scher und akustischer Darstellung im 
Film über die zeitgleiche Darbietung 
her; Bewegungen im geometrischen 
Raum entsprechen Bewegungen im 


Klangraum, zum Beispiel Treppenstei- 
gen einer aufsteigenden Tonfolge 


MIDI (Musical Instrument Digital 
Interface) 

Ein Protokoll zum Datenaustausch zwi- 
schen verschiedenen Komponenten 
einer digitalen Klangaufbereitung, wie 
zum Beispiel zwischen Keyboard, Com- 
puter und Sampler 


mimetisch 
nachahmend 


Mischung 

Zusammenführen aller Toninformatio- 
nen aus den Sektoren Sprache, Geräu- 
sche und Musik, die dabei in Lautstärke, 
Klangfarbe und räumlicher Positionie- 
rung aufeinander abgestimmt werden 


Mittelohr 

Jener Teil des Ohrs zwischen Trommel- 
fell und ovalem Fenster, in dem sich die 
Gehörknöchelchen befinden und der 
zum Druckausgleich mit dem Rachen- 
raum verbunden ist 


Mitten, mittig 
Frequenzband zwischen ca. 120 und 
2.000Hz 


Modalität > Sinnesmodalität 


Modifikation 
Veränderung des Bedeutungsgehalts 
durch die Interaktion von Bild und Ton 
(> Mehrwert) 


monokausal 
Auf eine einzige Ursache zurückzufüh- 
ren 


Monolichtton 
Einkanalige Lichttonaufzeichnung 


Montage 

Zusammenfügen filmischer Elemente 
(Bild, Ton) zu einem erzählerischen 
Ganzen 
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morphologisch 
Die Gestalt betreffend 


Motiv 
In der Musiktheorie die kleinste selbst- 
standige melodische Einheit 


MS-Stereofonie 

Kombiniert ein Mitten- (M) mit einem 
Seitensignal (S); das Mittensignal wird 
durch ein axial positioniertes Mikrofon 
mit Nieren-, Supernieren- oder Keulen- 
charakteristik, das Seitensignal durch 
ein radial angeordnetes Mikrofon mit 
Achtercharakteristik aufgenommen; 
eine Matrix errechnet daraus die beiden 
Stereoinformationen 


Musique concrete 

Begriff von Pierre Schaeffer (1948) zur 
Bezeichnung einer Kompositionsweise, 
in der das Klangmaterial aus Tonauf- 
nahmen von natürlichen (= konkreten) 
Schallereignissen besteht, die aufeinan- 
der abgestimmt, verfremdet und rhyth- 
misiert werden 


Nachhallzeit 

Zeitraum, in dem nach Abschalten ei- 
ner Schallquelle der Schalldruckpegel 
um 60dB sinkt 


Nadelton 

Aufzeichnungsverfahren der frühen 
Tonfilmzeit, bei dem ein Plattenspieler 
mit dem Projektor verbunden wird 


Nagra 

Portable Tonbandmaschine, unver- 
wüstlich, mit hervorragenden Eigen- 
schaften; die analoge Version war wäh- 
rend Jahrzehnten das Standardgerät 
zur Filmtonaufnahme 


neuronal 
Aus Neuronen (Nervenfasern) beste- 
hend 


New Hollywood 
Bezeichnung für jene Generation von 


Filmregisseuren, die Ende der 1960er-, 
Anfang der 1970er-Jahre in den USA 
mit veränderten Produktionsformen 
und Gestaltungsstrategien einen Um- 
bruch einleiteten 


Oberton 
Element eines Klangs, > harmonisch, 
— Klangfarbe 


objektiv-gerichtet 

Begriff von Metz (1991: 152) für deut- 
liche Färbungen der Bild- und Tonele- 
mente, die jedoch im Gegensatz zur 
Subjektivierung keiner Figur zuzu- 
schreiben sind 


Objektpermanenz 

Begriff von Piaget; er bezeichnet damit 
das Verständnis des Kleinkinds, dass 
Objekte weiterexistieren können, ob- 
wohl sie momentan abwesend sind 


obligatorische Merkmale 
Sind notwendig, damit ein Objekt iden- 
tifiziert werden kann (> Typ) 


Offset 

Abruptes Ende eines andauernden Ge- 
räuschs, das eine Aufmerksamkeitszu- 
wendung auslöst (> Onset) 


Oktave 

Musikalisches Intervall, bei dem sich 
die Frequenzen im Verhältnis 1:2 ver- 
halten 


Oktavenphänomen 

Die Frequenzverdoppelung (Oktavie- 
rung) bildet in unterschiedlichen musi- 
kalischen Systemen die wichtigste Ba- 
sis für die Einteilung von Tonhöhen in 
Tonleitern 


Okularisierung 
Begriff von Gaudreault/Jost (1990) für 
visuelle Subjektivierungen 


on the air 
Begriff von Chion (1990: 68) für diege- 
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tische Klangobjekte, die aus Radios, 
Lautsprechern, Telefonen usw. klingen 


Onomatopöen 
Sprachliche Lautmalereien 


Onset 
Abruptes Einsetzen eines Geräuschs, 
das eine Aufmerksamkeitszuwendung 
auslöst 


Orientierungslaut 
Klangobjekt, das ein geografisches, so- 
ziales oder kulturelles Setting definiert 


Orientierungsreaktion 

Physiologische Reaktion (Absinken des 
Hautwiderstandes oder Veränderungen 
der Puls- oder Atemfrequenz) oder Ver- 
haltensreaktion (z.B. Kopfbewegung 
in Richtung der Schallquelle), ausge- 
löst durch eine Veränderung der Um- 
welt 


Originalaufnahme 
Tonaufnahme, die während des Dre- 
hens live hergestellt wird 


orthochromatisch 
Filmemulsion, die nur für die Wellen- 
längen von grünem und blauem Licht 
empfindlich ist, im Stummfilm bis ca. 
1926 gebräuchlich 


otoakustische Emission 
Messbare Schallemission des Ohrs 


ovales Fenster 
Membran zwischen Mittel-und Innen- 
ohr 


panchromatisch 

Filmmaterial, das für alle Wellenlän- 
gen des sichtbaren Lichts gleicherma- 
ßen empfindlich ist 


parallel distribuiertes Netz 
Synonym für > konnektionistisches 
Netz 


Paramount Case 

Amerikanischer Gerichtsentscheid, der 
1948 die großen Hollywood-Studios 
zwang, sich wegen monopolistischer 
Praktiken von ihren Kinoketten zu tren- 
nen 


Pars pro toto 
Rhetorische Figur: Teil für das Ganze 


Pegel 
— Schalldruckpegel 


Perspecta Stereophonic Sound 
Pseudostereofonisches Verfahren, bei 
dem das Monosignal über Steuerim- 
pulse verschieden positionierten Laut- 
sprechern zugespielt wird 


Perzept 
Wahrnehmungsinhalt 


perzeptionsgeleitete Struktur 

Begriff von Wuss (1983) zur Beschrei- 
bung von Serien ähnlicher Reizkonfi- 
gurationen 


Phantomschallquelle 

Hören wir ein akustisches Ereignis mit 
gleicher oder unterschiedlicher Intensi- 
tät bzw. Phasenlage aus zwei Lautspre- 
chern, errechnet das Gehirn eine virtu- 
elle Position des Klangobjekts, die sich 
auf der Verbindungslinie zwischen den 
Lautsprechern befindet 


Phasing 

Durch die Überlagerung zweier iden- 
tischer Signale, die geringfügig zeit- 
lich verschoben sind, entstehen Auslö- 
schungen und Verstärkungen 


Phonem 

Kleinste bedeutungstragende Lautein- 
heit einer Sprache, im Deutschen z.B. 
[b] oder [p] 


Phrase 
In sich abgeschlossener dynamischer 
Bogen in der Musik 
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phylogenetisch 
Im Lauf der menschlichen Evolution 
entstanden 


plastische Konnektionen 
Im — konnektionistischen Netz verän- 
derliche Nervenverbindungen 


Plug-in 

Software zur digitalen Bearbeitung von 
Tonaufzeichnungen, die in Digital Au- 
dio Workstations integriert werden kann 


Pointof View (PoV) 

Oberbegriff für Blickpunkt; bezeichnet 
meist den optischen Blickpunkt einer 
Figur, der von der Kamera simuliert 
wird (> Subjektivierung) 


Pop-out-Effekt 

Ein singuläres Ereignis, das aufgrund 
seines Kontrasts zum Umfeld unwill- 
kürliche Aufmerksamkeit auf sich zieht, 
zum Beispiel ein lauter Knall in der Stille 


prägnant, Prägnanz 
Genau, treffend und knapp 


Prämisse 
Voraussetzung 


Präsenzen 
Frequenzen zwischen ca. 2.000 und 
6.000 Hz 


Priming 
Voraktivierung der Aufmerksamkeit; 
durch das Priming wird ein bestimmtes 
Bedeutungsfeld geöffnet, an welches 
nachfolgende Informationen angepasst 
werden 


Programm-Musik 

Musik, die eine außermusikalische Be- 
deutung darzustellen versucht, bei- 
spielsweise einen Handlungsablauf 


prosodisch 
Die klanglichen Aspekte der Sprache 
(Melodie, Rhythmus) betreffend 


Prototyp 

Vorstellungsbild, das tiber die Mittel- 
wertbildung der menschlichen Erfah- 
rung mit vielen Objekten der gleichen 
Klasse zustande kommt (> Typikalitat) 


pseudoharmonisch 

Komplexer Ton, bei dem die Obertöne 
leicht neben den ganzzahligen Vielfa- 
chen des Grundtons liegen; werden von 
ebenen und gekrümmten Platten (u.a. 
Glocken) erzeugt 


Psychoakustik 
Teilgebiet der Psychophysik, das sich 
mit den Hörempfindungen befasst 


Psychophysik, psychophysisch 
Lehre vom Zusammenhang zwischen 
Reiz und Empfindung 


Radio Mike 
— Funkmikrofon 


Rauigkeit 

Nach Terhardt (1998: 283) schnarrende 
Hörqualität, die sich aus relativ raschen 
Veränderungen ergibt; je höher die 
Modulationsfrequenz von mindestens 
30 Hz, desto rauer erscheint der Ton 


Raumsimulator 
Effektgerät zur exakten Simulation von 
akustischen Raumparametern 


Redundanz, redundant 
Verdoppelung einer Information 


Reflexion 
Schallrückwurf beim Auftreffen auf 
eine harte Begrenzungsfläche 


Reiz-Reaktions-Mechanismus 

Die (behavioristische) Annahme, dass 
ein bestimmter Reiz unweigerlich eine 
spezifische Reaktion auslöst 


Remake 
Neuauflage eines bereits bestehenden 
Films, mit anderer Besetzung und an 
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die zeitgenössischen Sehgewohnheiten 
angepasst 


Remix 
Kreation und Mischung einer neuen Ton- 
spur zu einem bereits vorhandenen Film 


Repräsentation (Darstellung) 
Bezeichnet eine Beziehung zwischen 
Original und Abbild, die eine Transfor- 
mation nicht ausschließt, zum Beispiel 
A klingt wie B 


Reproduktion (Wiedergabe) 
Bezeichnet eine Gleichheitsbeziehung 
zwischen Original und Abbildung, for- 
melhaft ausgedrückt A ist wie B 


Re-Recording Engineer 
Amerikanische Bezeichnung für Misch- 
tonmeister (> Mischung) 


Richtcharakteristik (Mikrofon) 
Kugel: In alle Richtungen ungefähr 
gleich empfindlich 

Niere: Empfindlichkeit axial ungefähr 
nierenförmig mit größter Dämpfung 
für rückseitig einfallenden Schall 
Superniere: Stärker gerichtet als die 
Niere und mit größter Dämpfung im 
Winkel von 45° zur Achse hinten 
Keule: Sehr starke Richtwirkung 

Acht: Bipolare Empfindlichkeit, die 
man sich als eine Acht quer zur Mikro- 
fonachse vorstellen kann 


Rock-’n’-Roll-Verfahren 
Mischungsverfahren, in welchem kleine 
Abschnitte bearbeitet werden; seit Ende 
der 1960er-Jahre tibliches Verfahren, das 
auf zwei technischen Voraussetzungen 
beruht: Alle Geräte müssen im Vor- und 
Rücklauf exakt miteinander verkoppelt 
sein und es muss die Möglichkeit be- 
stehen, an jedem beliebigen Punktun- 
hörbarindie Aufnahme einzusteigen 


Sampler 
Eine digitale Speichereinheit, von der 
das Tonmaterial über die Tastatur eines 


Keyboards mehrstimmig abgerufen, be- 
liebig rhythmisiert oder in andere Ton- 
lagen transponiert werden kann 


Sampling-Frequenz 

Frequenz von üblicherweise 44,1 oder 
48 kHz, mit der die kontinuierliche Ton- 
information zur Digitalisierung in eine 
Zahlenfolge gewandelt wird 


Schall 

Mechanische Schwingungen im Fre- 
quenzbereich zwischen 20 und 
20.000 Hz 


Schalldruckpegel 

Da bereits ein mittlerer Schalldruck die 
leisesten noch wahrnehmbaren Töne 
um ein Tausendfaches übersteigt, wird 
der Schalldruckpegel als logarithmi- 
sches Maß im Verhältnis zu einem vor- 
gegebenen Referenzschalldruck p, von 
2*10”Pa (Pascal) mit der Maßeinheit 
[dB] verwendet 


Schärfe 
— Klangfarbe, die durch die hochfre- 
quenten Anteile bedingt wird 


Schema 
Große Wissenseinheit, die im Gedächt- 
nis abgelagert ist 


Selektion 
Auswahl 


Semantik, semantisch 
Lehre von den Bedeutungen 


semisubjektiv 

Begriff von (Metz 1991: 117) für einen 
Bildausschnitt, welcher der Gedanken- 
welt einer Figur zugeordnet werden 
kann, deren optischer Blickpunkt aber 
leicht vom subjektiven abweicht, indem 
die Figur noch im Anschnitt zu sehen 
ist 


sensorisch 
Die Sinneswahrnehmungen betreffend 
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SepMag 

Die Tonspur befindet sich auf einem ge- 
sonderten Magnetband oder -film und 
ist synchron mit dem Bild verkoppelt 


sequenziell 
aufeinander folgend 


Setting 
Schauplatz eines Films 


Signal 

1) Klangobjekt, das einen gesellschaft- 
lich definierten kommunikativen Ge- 
halt hat, z.B. Türklingel 

2) in der physikalischen Verwendung 
jedes Schallereignis bzw. der elektrische 
Impuls, den es über einen elektroakus- 
tischen Wandler auslöst 


Signal-Rausch-Abstand 

Differenz zwischen dem Pegel des 
Nutzschalls und dem Pegel des Grund- 
rauschens [dB] 


Simulation 

Vortäuschung; bei Experimenten wirk- 
lichkeitsgetreue Nachahmung einer Si- 
tuation 


Sinnesmodalität 
Wahrnehmungskanal (z.B. Sehen, Hö- 
ren); jede Modalität ist auf spezifische 
Energien ausgerichtet, das Hören bei- 
spielsweise auf Schallwellen 


Sinuston 
Einfacher Ton, der nur aus einer perio- 
dischen Schwingung besteht 


Slapstick 

Körper- und bewegungsbetonte Form 
der Komödie, benannt nach dem Requi- 
sit (dt. Narrenpritsche), mit dem die Be- 
wegungen akzentuiert wurden 


Sound Designer 

Amerikanische Berufsbezeichnung für 
die kreative Persönlichkeit, die für die 
gesamte Herstellung einer Filmtonspur 


verantwortlich ist; seit Ende der 1970er- 
Jahre in Nordkalifornien gebräuchlich 


Sound Effects 
Amerikanische Bezeichnung für Geräu- 
sche auf der Tonspur 


Souveränität 
Unabhängigkeit, Eigenständigkeit; hier 
die Eigenständigkeit des Klangobjekts 


spektrale Zusammensetzung 
Zusammensetzung eines Klangs aus 
einem Grundton und mehreren Ober- 
tönen (> harmonisch) 


Split-Surround 
Zweikanalige Surround-Information 
(Surround rechts, Surround links) 


Sprossenschrift 
Optisches Tonaufzeichnungsverfahren 
(> Lichtton), bei dem die akustische In- 
formation mit verschiedenen Grauwer- 
ten codiert wird 


Stereomikrofonanordnung 
Grundmuster zur Platzierung von Mi- 
krofonen bei Stereoaufnahmen 


Stereotyp 

Begriff aus der Sozialpsychologie, der 
die Verfestigung von Meinungen zu 
Vorurteilen bezeichnet; bezogen auf die 
Tonspur ein Klangobjekt, das intertex- 
tuell in einem bestimmten erzähleri- 
schen Kontext oder einem bestimmten 
Genre wiederholt verwendet und des- 
halb automatisch und unterschwellig 
rezipiert wird 


Steuerfrequenz 

Eine unhörbare Frequenz, die auf das 
Nutzsignal aufgespielt wird, um eine 
Wiedergabemaschine zu steuern 


Stimmton 
Bezugsfrequenz von 440 Hz zur Stim- 
mung von Musikinstrumenten 
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Stimulus 
Reiz 


Streaming 
Aufspaltung komplexer akustischer 
Reizmuster in Ströme 


Ströme 

Ereignisketten, die aus einzelnen Klang- 
objekten bestehen, z.B. Stimmen in 
einem polyfonen musikalischen Werk 


Subjektivierung 

Darstellung des Blickpunkts einer Figur 
sowie anderer Spielarten von subjektiv 
transformierten Wahrnehmungen wie 
Träume, Halluzinationen, Erinnerun- 
gen oder Visionen 


Substitution 

Ersatz: Das im Film sichtbare Objekt 
wird mit dem Geräusch einer anderen 
Quelle versehen 


Subwoofer 
Lautsprecher zur Wiedergabe von Bässen 


Summenlokalisation 
Verrechnungsprozess des Gehirns 
bei der Wahrnehmung von Stereoton 
(> Phantomschallquelle) 


Superzeichen 

Verbünde von Zeichen zu Zeichen hö- 
herer Ordnung; ihre Bedeutung ergibt 
sich nicht aus dem Gegenstand allein, 
sondern wird durch eine kulturelle 
Praxisoder einen Textzusammenhang 
modifiziert (> Symbol, > Stereotyp, 
— Signal, > Leitmotiv) 


Surround 

Toninformation, die als Klangfeld über 
mehrere seitlich und hinten platzierte 
Lautsprecher im Kino dargeboten wird 
(> Split-Surround) 


S.V.A. (Stereo Variable Area) 
4-kanaliges Stereosignal, das über eine 
Matrix auf zwei Spuren reduziert wird; 


der Informationsträger ist eine Licht- 
tonspur mit Zackenschrift 


Symbol 
Konkretes Zeichen oder Bild, das stellver- 
tretend für ein abstraktes Konzept steht 


Synästhesie 

Projektion einer > Sinnesmodalität in 
eine andere, zum Beispiel das Entstehen 
von Farbeindrücken beim Musikhören 


Synchrese 

Begriff von Chion (1990: 55), aus «Syn- 
these» und «Synchronismus» zusam- 
mengesetzt, für den Verschmelzungs- 
prozess, der bei gleichzeitiger Dar- 
bietung eines optischen und eines 
akustischen Ereignisses stattfindet 


Synekdoche 
Rhetorische Figur, in der ein Teil das 
Ganze vertritt 


Synkretismus, synkretistisch 
Verschmelzung von Auffassungen aus 
verschiedenen Religionen oder Denk- 
schulen 


Tauchspulenmikrofon 

Dynamisches Mikrofon, in dem eine an 
der Membran befestigte Spule im Spalt 
eines Magneten bewegt wird 


Tempo 

Maß für die Geschwindigkeit einer mu- 
sikalischen Interpretation [Schläge pro 
Minute, beats per minute, bpm] 


Thema 
Aus verschiedenen Motiven zusam- 
mengesetzte musikalische Gestalt 


Timbre 
Klangfarbe 


Todd-AO (Ton) 

Bezeichnung für 6-Kanal-Magnetton- 
systeme mit echtem Stereoton und voll- 
ständiger Trennung der Spuren 
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Token 
Ein bestimmtes Exemplar einer Objekt- 
klasse, beispielsweise ein bestimmter 
Dackel im Gegensatz zur Hunderasse 
Dackel 


tonal 
Nach den traditionellen harmonischen 
Prinzipien auf einen Grundton bezogen 


Tonhöhe 

Subjektive Empfindungsgröße, die 
in einem messbaren Zusammenhang 
zur Frequenz des > Grundtons eines 
Klangs steht 


Tonperspektive 

Koordination der akustischen und op- 
tischen Raumparameter bei der Film- 
darstellung 


Top-down 

Prozess der Aufmerksamkeitssteue- 
rung, in dem Hypothesen und Gedan- 
ken die willkürliche Aufmerksamkeit 
lenken (Gegensatz — Bottom-up) 


triggern 
auslösen 


Typikalität 

Objekte können als verschieden typisch 
aufgefasst werden je nachdem, wie sehr 
sie mit dem unter — Prototyp beschrie- 
benen Mittelwertübereinstimmen oder 
sich von ihm unterscheiden: eine Am- 
sel ist ein typischerer Vogel als ein Pin- 
guin 


UKO 

Unidentifizierbares Klangobjekt, des- 
sen Quelle weder im Bild sichtbar ist, 
noch aus dem Kontext erkennbar wird 


unidentifizierbares Klangobjekt 
> UKO 


used future 

Begriff des Regisseurs George Lucas 
und des Sound Designers Ben Burtt zur 
Bezeichnung der «rostigen» Beschaf- 
fenheit des Tonvokabulars in der STAR 
Wars-Trilogie 


Valeur ajoutée 
Mehrwert 


Verzögerung 
Zeitliche Differenz zwischen dem Ein- 
treffen des direkten Schalls und der ers- 
ten Reflexion 


Vestibulärsystem 
Gleichgewichtsorgan im Innenohr 


Vitaphone 
— Nadeltonverfahren der Warner Bro- 
thers 


Voiceover 
Erzählerstimme 


Workstation 
— Digital Audio Workstation 


Zackenschrift 

Lichtton, bei dem die Toninformation 
über die Zustände «geschwärzt» oder 
«nicht geschwärzt» dargestellt wird, die 
sich vertikal zur Laufrichtung des Films 
in der Breite verändern 


zerebrale Lateralisation 
Aufgabenteilung zwischen den beiden 
Hälften des menschlichen Großhirns 


Zirkuseffekt 

Stille als Antizipation einer Gefahr (wie 
der abgebrochene Trommelwirbel vor 
atemberaubenden Darbietungen im 
Zirkus) 
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THE SOUND or Music 14, 15, 462 

SOUTH PAcırıc 14, 462 

SPEED 171, 464 

STAR Wars 13, 19, 51, 57, 61, 119, 124, 
144, 179, 211, 312, 463 

STAR Wars EPISODE I 226 
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diegetisch 38, 49, 57, 58, 162, 169, 170, 
211, 302, 303, 346, 377, 387, 392, 393, 
398, 417, 450, 495, 496 

diffuser Schall 54, 58, 108, 145, 209, 302, 
321, 495 

digital 55, 59, 61, 63-68, 94, 157, 226, 
240, 241, 286, 402, 414, 415, 494, 495, 
497, 500, 503, 504 

Digital Audio Workstation 66, 495, 503, 
507 

Digital Theater Sound siehe DTS 

Digital Versatile Disc siehe DVD 

direkter Schall 91, 301, 368, 495, 507 

diskret 38, 48, 49, 53, 55, 65, 237, 495 

dissipatives System 180, 495 

Dissonanz 134, 135, 155, 165, 224, 267, 
268, 270, 495 

Dissoziation 149, 155, 392, 394, 395-396, 
495 

Dolby Stereo 13, 53, 208, 500 

Dopplereffekt 46, 106, 107, 258, 293, 495 

Druckausgleich 194, 496, 500 

DTS 55, 414, 495 

DVD 55, 495 

Dynamik 220, 221, 224, 225-243, 303, 
415-419, 430, 495 

Dynamisches Mikrofon 36, 494, 495, 
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Echo 113, 120, 301, 323, 339, 377,378, 495 
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Filter 16, 68, 96, 107, 196, 225, 239, 245, 
246, 337, 496 

Filmbildformat 494 

Filmtonmeister 18, 62, 93, 157, 499 
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Frequenz 21, 32, 40, 42-43, 44, 63, 64, 90, 
92, 111, 136, 159, 181, 192-224, 225, 
254, 255, 257, 258, 262, 269, 300, 301, 
336, 337, 338, 402, 415, 418, 431, 432, 
446, 494, 496, 497, 501, 502, 503, 504, 
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Frequenzanteile 228 

Frequenzband 245, 418, 496, 500 

Frequenzbereich 44, 90, 107, 136, 159, 
179, 193, 199, 200, 204, 205, 206, 208, 
210, 224, 225, 353, 404, 417, 418, 431, 
446, 493, 494, 504 

Frequenzbündel 207, 208, 223, 258, 294, 
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Frequenzdistribution 220-222, 239, 417, 
431, 496 

Frequenzgang 22, 32, 34, 35-36, 39, 41, 
92, 136, 357, 418, 496 

Frequenzmodulation 228, 496 

Frequenztrennung 256, 259 

Frequenzverdoppelung 193, 203, 501 

Frequenzverteilung 112, 206, 351, 415, 
417-418, 419, 446, 496 

Funkmikrofon 62, 496, 503 
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Gate 400, 497 

Gehörknöchelchen 194, 493, 497, 500 

Gehörschnecke 494 

Generalisierung 113, 179, 323-329, 497 

Genreswitching 
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Gerausche 

Geräuschemacher 18, 19, 36, 93-94, 141, 
143, 278, 281, 287, 332, 346, 496, 497 

Grauwert 28, 34, 35, 505 
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Haarzellen 42, 90, 195, 245, 497 

Haas-Effekt 43, 44, 497 

Hall 36, 59-60, 66, 67, 96, 107, 108, 180, 
294, 299, 302, 306, 309, 378, 385, 392, 
393-394, 399-400, 404, 432, 497 

Hallraum 59, 120, 497 

Hallgerät 59, 73, 88, 399, 496 

Hammer 194, 225, 497 
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Hertz 199, 206, 497 

Hochfrequenz-Vormagnetisierung 40, 
497 
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Interferenz-Richtmikrofon 144, 498 
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Kanonisierung 176, 498 

Kapazitätsentlastung 494 

Katharsis 241, 498 

Kausalitätsbeziehung 75, 76, 139, 145, 
498 

Keulencharakteristik 35, 144, 498, 501, 
504 

Keyboard 66, 67, 500, 504 

Kinotonformat 495 

Klang 17, 18, 20, 21, 44, 46, 48, 62-66, 
79, 80, 84, 91, 92, 93, 102, 104, 106, 
108, 140, 152, 160, 170, 182, 201-204, 
207, 211, 223, 227-228, 232, 238, 242, 
264, 269-271, 274, 275, 277, 282, 283, 
284, 287, 299, 321, 330, 332, 335-339, 
347, 351, 353, 355, 356, 375, 418, 419, 
420, 421, 446, 495-496, 497, 498, 501, 
505, 507 

Klangästhetik 14, 105, 118 

Klangbild 45, 53, 85, 434, 446 

Klangfarbe 20, 31, 80, 159, 198, 203-208, 
245, 252, 257, 258, 260, 261, 262, 269, 
274, 292, 293, 294, 301, 353, 493, 498, 
500, 501, 504, 506 

Klangfeld 145, 154, 506 

Klanglichkeit 17, 22, 24, 34-38, 60, 86, 
88, 106, 115, 117, 128, 133, 146, 148, 
179, 206, 211, 276, 320, 327, 331, 333- 
334, 338-340, 344, 345, 349, 351-352, 
353, 354, 356, 359, 370, 377, 378, 432, 
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Klangobjekt 20-25, 36, 37, 44, 53-54, 
60, 64, 66, 68, 75, 77, 78, 79, 80-81, 
86, 88, 92-96, 100-103, 105, 107-108, 
111-113, 117-121, 123-130, 131, 132, 
136-137, 142-146, 150-154, 156-157, 
158-162, 174-175, 181-182, 186-188, 
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227-228, 231-233, 235, 239, 244, 249, 
253-262, 268, 271-273, 275-277, 282. 
283, 285-289, 291, 293-294, 298-299, 
302-303, 305, 309, 312, 314, 317, 319, 
322, 323, 327, 332, 335, 343-344, 350, 
353-359, 364, 368, 370, 374-378, 383, 
392, 393, 396, 399, 402, 404-405, 408, 
415, 417-419, 421, 429, 431-434, 436- 
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437, 444, 446-448, 452-454, 493, 495, 
496, 498, 499, 500, 502, 505, 506, 507 

Klangsphäre 91, 122, 243, 310, 398 

Klangteppich 364, 417 

Klassem 292, 499 

kognitiv 77,79, 81,90, 96, 149, 155, 239, 
244, 253, 289, 307, 308, 366, 367, 369, 
370, 371, 395, 446, 499 

Kondensatormikrofon 35, 62, 87, 92, 
150, 493, 499 

konnektionistisches Netz 24, 111, 112, 
248, 499, 502, 503 

Kontrapunkt 133-135, 148, 270, 499 

Kopfhörer 33, 44, 197, 245, 495, 499 

Kortex 196, 198, 499 

kortikal 247, 499 
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L 

Label 13, 51, 102, 346, 499 
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Lateralisation siehe zerebrale Laterali- 
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Lautsphäre 21, 36, 41, 84, 91, 102, 118, 
123, 208, 232, 245, 249, 263, 267, 273, 
305, 306, 308-311, 368, 393, 397, 408, 
410, 499 

Lautsprecher 30, 31, 35, 41, 43-50, 54, 
56, 58, 59, 73, 84, 88, 104, 107, 144, 
150, 201, 238, 393, 415, 495, 496, 497, 
502, 506 

Lautstärke 34, 53, 67, 68, 95, 107, 108, 112, 
124, 148, 162, 196, 200, 225-227, 232, 
236, 237-243, 245, 252, 254, 261, 263, 
268, 280, 286, 292, 306, 336, 352, 368, 
369, 370, 404, 416, 434, 493, 495, 499, 500 

Leitmotiv 24, 117, 158, 175, 182-187, 
189, 249, 312, 360, 420, 437, 499, 506 

Lichtton 28-32, 35-38, 40, 47, 53-55, 60, 
136, 152, 240, 271, 272, 499, 500, 504, 
505, 507 

Location Sound Mixer siehe Filmton- 
meister 

Longitudinalwellen 193, 499 
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magnetische Beschichtung 494 

magnetische Schallspeicherung 39, 500 

Magnetton 39, 40, 47, 49, 50, 52, 54, 60, 
86, 122, 211, 351, 500, 506 


Mainstreamfilm 21, 22, 37, 61,77,79,93, 
113, 119, 122, 126, 130, 135, 141, 148, 
152, 161, 164, 165, 168, 169, 176, 178, 
180, 201, 223, 224, 283, 292, 307, 311, 
317, 345, 349, 362, 363, 364, 366, 370, 
376, 395, 415, 500 

Making of 242, 500 

manifeste Bedeutung 500 

Matrix 45, 53, 500, 501, 504 

matriziert 53, 55, 500 

Mehrspurformat 495 

Mehrspurverfahren 496 

Mehrwert 76, 86, 125, 142-149, 277, 421, 

500, 507 

Membran 35, 36, 90, 499, 502, 506 

metadiegetisch 383, 437 

Mickey-Mousing 46, 283, 500 

Mikrofon 29, 31, 35, 36, 44, 46, 48, 59, 62, 
64, 73, 85, 87-93, 123, 124, 144, 145, 
150-151, 194, 281, 287, 302, 368-369, 
493, 494, 495, 496, 497, 498, 499, 501, 
503, 504, 505, 506 

Mikrofonmembran 44, 493, 499 

MIDI (Musical Instrument Digital Inter- 
face) 67, 495, 500 

mimetisch 74, 88, 121, 124, 161, 263, 279, 
345, 500 

Mischtonmeister siehe Re-Recording 

Engineer 

Mischung 19, 37, 38, 40, 54, 60-62, 67, 

87, 95-96, 124, 153, 241, 244, 288, 326, 

368, 369, 500, 504 

Mittelohr 194, 225, 496, 497, 500 

Mitten 45, 300, 418, 496, 500, 501 

Modalität 81, 138, 141, 149, 154, 247, 

395, 500, 505 

Modifikation 143, 146, 169, 172, 175, 
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monokausal 192, 500 

Monolichtton 50, 59, 96, 128, 260, 500 

Montage 18, 40, 46, 85, 95, 133, 134, 135, 
142, 163, 234, 243, 271, 272, 303, 329, 
362, 367, 375, 406, 407, 409, 443, 445, 
448, 500 

morphologisch 105, 118, 258, 269, 290, 
293, 305, 501 

Motiv 176, 183, 185, 186, 189, 202, 245, 
294, 314, 315, 321, 324, 342, 351, 435, 
441, 442, 501, 506 
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Musique concrete 131, 206, 272-273, 
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Nachsynchronisation 18, 86, 124, 141, 

182, 493 

Nadelton 31, 32, 55, 501, 507 

Nagra 66, 122, 501 

Nervenimpuls 498 

Nervenfasern 195, 495, 501 

Nervenzelle 497, 499, 111, 139 

Neurologie 495 

neuronal 42, 90, 139, 195, 256, 263, 307, 

370, 498, 501 

New Hollywood 13, 16, 17, 19, 22, 68, 
119, 122, 123, 125, 152, 165, 345, 365, 
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ierencharakteristik 36 

utzschall 92, 196, 505 


N 
N 


(0) 

Oberton, Obertöne 136, 203, 204, 205, 
207, 228, 418, 431, 497, 498, 501, 503, 
505 

objektiv-gerichtet 377, 405, 408, 501 

Objektpermanenz 110, 154, 501 

objet sonore siehe Klangobjekt 

obligatorische Merkmale 112, 114, 493, 
496, 501 

Offset 251, 501 

Ohr 22, 33, 41, 42, 43, 44, 68, 73, 88, 
89-91, 93, 137, 151, 152, 159, 193, 194- 
195, 197-199, 201, 203, 208-209, 210, 
224, 225, 226, 238, 244, 245, 247, 262, 
264, 266-267, 274, 285, 299, 303, 319, 
327, 373-374, 381, 397, 417, 493, 494, 
495, 496, 497, 498, 500, 502, 507 

Oktave 193, 203, 431, 501 

Oktavenphänomen 202-203, 501 

Oktavierung 203, 501 

Okularisierung 373, 501 

on the air 107, 501-502 

Onomatopöen 141, 282, 283, 502 

Onset 251, 501, 502 

Orientierungslaut 291, 305-307, 309, 
310-314, 316, 318, 320, 321, 323, 326, 
328, 329, 344, 352, 357, 360, 364, 419- 
420, 433, 502 


Orientierungsreaktion 155, 251-252, 502 
Originalaufnahme 18, 38, 62, 64, 91, 

120, 268, 280, 286, 288, 502 
orthochromatisch 33, 502 
otoakustische Emission 90, 195, 502 
ovales Fenster 195, 502 


P 

panchromatisch 33, 502 

parallel distribuiertes Netz 502 

Parallelmontage 167, 169, 324, 328-329, 
345, 397, 443 

Paramount Case 14, 47, 502 

Pars pro toto 166, 502 

Pegel 64, 95, 201, 206-208, 225, 226-227, 
233, 239, 240-243, 400, 415, 416, 418, 
430, 502, 505 

Pegelspitze 415, 445 

Pegelsprung 251, 258, 415 

periphere Ereignisse 250, 494 

Perspecta Stereophonic Sound 49, 502 

Perzept 95, 260, 289, 312, 502 

Perzeption 253, 292 

perzeptionsgeleitete Struktur 290, 292, 
295, 502 

Phantomschallquelle 43, 48, 502, 506 

Phasenlage 42, 502 

Phasing 145, 148, 502 

Phonem 140, 200, 257, 284, 301, 502 

Phrase 85, 262, 284, 502 

phylogenetisch 102, 152, 334, 503 

plastische Konnektionen 111, 178, 499, 
503 

Plug-in 67, 402, 495, 503 

point d'écoute siehe Hörpunkt 

Point of View (PoV) 362, 366, 373, 383, 
386, 392, 394, 397, 398, 404, 410, 421, 
422, 426, 427, 441, 442, 445, 449, 503 

Pop-out-Effekt 394, 503 

Postproduktion 18, 64, 67, 88, 91,93, 95, 
114, 120, 122, 123, 242, 495 

PoV siehe Point of View 

Prägnanz 179, 184, 503 

Prämisse 24, 77, 78, 83, 112, 136, 192, 
503 

Präsenzen 38, 90, 154, 157, 200, 288, 299, 
305, 347, 349, 352, 358, 379, 432, 496, 
503 

Priming 186, 188, 249, 311, 422, 433, 503 

Programm-Musik 503 
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prosodisch 197, 293, 364, 503 

Prototyp, prototypisch 13, 19, 51, 66, 67, 
110, 112, 120, 122, 129, 143, 146, 171, 
174, 179, 231, 236, 275, 308, 318, 344, 
357, 422, 432, 445, 503, 507 

pseudoharmonisch 159, 205, 503 

Psychoakustik, Psychoakustiker 24, 41, 
192, 207, 225, 503 


R 

Radio Mike siehe Funkmikrofon 

Rauigkeit 226, 228, 503 

räumliche Positionierung 87, 260 

Raumparameter 59, 91, 150, 153, 306, 
368, 503, 507 

Raumsimulator 59, 302, 503 

Redundanz, redundant 130, 134, 135, 
136, 144, 146, 148, 277, 379, 421, 503 

Reflexion 23, 36, 59, 135, 209, 240, 261, 
270, 300-301, 368, 409, 429, 495, 503, 
507 

Reiz-Reaktions-Mechanismus 209, 238, 
239, 417, 503, 95, 

Remake 15, 503-504 

Remix 53, 61, 84, 504 

Repräsentation 20, 21, 46, 48, 51, 64, 
74-75, 79, 80, 82-84, 86-87, 89, 91, 93, 
94, 95, 96, 108, 110, 112, 118, 120, 123, 
133, 139, 141, 143, 146-147, 150, 152, 
154, 156, 172, 177, 179, 185, 186, 240, 
248, 249, 250, 253, 254, 277, 285, 288, 
298, 300, 302, 307-308, 312, 334, 342, 
362, 364, 374, 376, 383, 392, 395-396, 
419, 421, 434, 504 

Reproduktion 69, 74, 78, 83, 210, 504 

Re-Recording Engineer 18, 395, 504 

Resonanzfrequenz 336-337 

Rezipient 75, 80, 82, 103, 113, 117, 124, 
126, 129, 130, 133, 136, 137, 146, 147, 
148, 162, 174, 178, 179, 180, 186, 187, 
189, 238, 239, 241, 242, 244, 248, 249, 
288, 292, 295, 310, 312, 320, 324, 327, 
369, 370, 393, 396, 397, 402, 417, 499 

Richtcharakteristik 35-36, 44, 92, 144, 
498, 504 

Rock-’n’-Roll-Verfahren 60, 61, 504 


S 
Sampler 55, 63, 66-67, 94, 500, 504 
Sampling-Frequenz 


Schall 20, 36, 39, 41, 42, 43, 45, 59, 63, 64, 
84, 91, 92, 108, 160, 193, 196, 204, 207, 
238, 246, 262, 269, 275, 301, 302, 335, 
337, 338, 368, 494, 495, 504, 507 

Schalldruck 193, 199, 200, 225, 226, 337, 
415, 494, 504 

Schalldruckpegel 35, 200, 225, 226, 301, 
498, 501, 502, 504 

Schallemission 20, 91, 498, 502 

Schallereignis 41, 159, 195, 274, 368, 
499, 501, 505 

Schallmodulation 30 

Schallplatte 29, 32, 41, 83, 92, 202, 252, 
271, 272, 273, 497 

Schallquelle 41, 43, 44, 45, 48, 53, 56, 87, 
91, 226, 251, 259, 301, 302, 337, 495, 
497, 501, 502 

Schallwelle 28, 30, 33, 36, 43, 44, 63, 82, 
90, 144, 193, 194, 199, 300, 301, 338, 
495, 496, 497, 498, 499, 505 

Schärfe 109, 207, 223, 226, 504 

Schema 178, 207, 238, 250, 299, 308, 504 

Schnittfrequenz 263, 398, 410, 420 

Schwarzblende 315, 362, 376, 396 

Schwingung 20, 35, 42, 59, 104, 193, 194, 
195, 199, 203-204, 271, 335, 336-337, 
493, 494, 497, 499, 504, 505 

Schwingungsfrequenz 336 

Seitenverhältnis 494 

Selektion 24, 87, 91, 151, 196, 244, 246- 
248, 250-251, 253, 290, 316, 368, 369, 
371, 402, 407—409, 411, 416, 504 

Semantik 79, 80, 100, 143, 158, 275, 293, 
504 

semantisch 24, 76, 77, 80, 81, 94, 103, 
108, 117, 145, 147, 153, 159, 186, 198, 
205, 224, 231, 244, 245, 247, 249, 252, 
253, 260, 263, 272, 273, 275, 276, 289, 
291, 292, 293, 294, 295, 361, 381, 392, 
393, 418, 423, 432, 447, 504 

semisubjektiv 408, 504 

sensorisch 76, 77-79, 95, 125, 133, 139, 
148, 155, 197, 203, 241, 242, 246, 247, 
251, 252, 253, 266, 289, 292, 293, 294, 
344, 345, 352, 397, 416, 418, 498, 505 

SepMag 39, 505 

sequenziell 139, 198, 251, 505 

Setting 25, 115, 116, 118, 150, 161, 167, 
172, 179, 181, 222, 298, 306, 313, 321, 
327, 328, 344, 502, 505 
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Signal 41, 45, 50, 55, 62, 63, 64, 92, 94, 136, 
139, 158-162, 166, 170, 179, 183, 187, 
201, 206, 331, 334, 352, 353, 415, 454, 
493, 495, 496, 497, 499502, 505, 506 

Signal-Rausch-Abstand 34-35, 37, 40 

Simulation 49, 124, 374, 378, 381, 394, 
405, 409, 503, 505 

Sinnesmodalität 110, 138, 321, 500, 505, 
506 

Sinuston 42, 159, 200, 201, 207, 212, 225, 
257, 332, 505 

Slapstick 280, 282, 284, 285, 505 

Sound Designer 13, 18, 19, 23, 57,70, 80, 
85, 94, 95, 119, 123, 124, 141, 144, 157, 
182, 224, 241, 251, 263, 278, 284, 287, 
309, 310, 314, 322, 331, 345, 353, 356, 
360, 375, 395, 402, 409, 505, 507 

Sound Effects 18, 287, 505 

Souveränität 133, 505 

spektrale Zusammensetzung 22, 64, 
204, 223, 505 

Split-Surround 53, 54, 505, 506 

Sprossenschrift 28, 29, 35, 499, 505 

Spule 506 

Stereomikrofonanordnung 48, 505 

Stereotyp 24, 36, 111, 119, 130, 133, 141, 
158, 176-183, 185, 210, 235, 237, 248, 
281, 292, 295, 308, 311, 318, 322, 323, 
328, 357, 358, 359, 407, 436, 505, 506 

Stereo Variable Area siehe S. V. A. 

Steuerfrequenz 62, 505-506 

Steuerspur 46, 496 

Stimmton 199, 506 

Stimulus 192, 252, 506 

Streaming 246, 253, 256, 258-260, 272, 
290, 369, 418, 506 

Ströme 253, 256-258, 259-260, 506 

Subjektivierung 25, 59, 149, 157, 282, 
289, 316-318, 362-411, 443, 493, 501, 
503, 506 

Substitution 141, 148, 278, 279, 287, 404, 
506 

Subwoofer 55, 506 

Summenlokalisation 43, 506 

Supernierencharakteristik 501, 504 

Superzeichen 24, 158, 187, 291, 292, 506 

Surround 49, 52, 53-58, 73, 97, 155, 208, 
321, 505, 506 

S. V. A. 53, 504 

Symbol, symbolisch 24, 110, 118, 141, 


158, 163-174, 176, 179, 183, 184, 185, 
187-189, 234, 240, 269, 270, 273, 275, 
283, 292, 295, 341, 347, 348, 356, 360, 
361, 369, 393, 400, 402, 405, 410, 419, 
422, 424, 429-442, 506 

Synästhesie 138, 270, 506 

Synchrese 140-142, 146, 506 

Synekdoche 166, 310, 506 

Synkretismus, synkretistisch 121, 170, 
506 


T 

Tauchspulenmikrofon 506 

Tempo 32, 87, 231, 256-257, 258, 260, 
262, 283, 506 

Thema 41, 118, 174, 185, 272, 293, 354, 
435, 506 

Timbre 203, 506 

Todd-AO 49, 506 

Token 306, 496, 507 

tonal 266, 269, 273, 274, 507 

Tonaufzeichnung 24, 34, 39, 64, 70, 74, 
76, 494, 496, 500, 503, 505 

Tonfolge 46, 183, 499, 500 

Tonhöhe 64, 195, 198, 199, 201, 202-204, 
225, 228, 245, 252, 257, 258-259, 269, 
284, 293, 294, 493, 495, 497, 501, 507 

Tonleiter 203, 501 

Tonmontage 66, 68, 94, 141 

Tonperspektive 59-60, 62, 89, 91, 150- 
153, 302, 369, 507 

Tonpostproduktion 64, 

Top-down 250, 507 

Totale 155, 298, 315, 428, 434, 445, 446, 
450, 496 

triggern 507 

Trommelfell 44, 90, 194, 494, 497, 498, 
499, 500 

Typikalität 143, 146, 503, 507 


U 

UKO 126, 127-130, 208, 211, 268, 275, 
282, 324, 327, 328, 389, 394, 402, 410, 
424, 425, 429, 431, 433, 507 

Unidentifizierbares Klangobjekt siehe 
UKO 

used future 125, 287, 332, 507 


v 
Valeur ajoutée 507 
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Verzögerung 29, 41, 43, 59, 301, 323, 
495, 507 

Vestibulärsystem 507 

Vitaphone 31, 32, 281, 507 

Voiceover 299, 302, 364, 373, 380, 383, 
393, 394, 406, 444, 445, 507 


w 
Wahrnehmungskanal 138, 505 


Workstation siehe Digital Audio Work- 
station 


Z 

Zackenschrift 28-29, 35, 37, 499, 504, 
507 

Zeitachse 141, 227, 255, 260, 498 

zerebrale Lateralisation 197, 499, 507 

Zirkuseffekt 236, 249, 507 


